**********************
大模型推理框架研发工程师(高级/资深)
  • 收藏职位
  • 分享职位
38-70万 北京 本科 3-5年 招聘 2 人 预计佣金 67.2K 04:29发布
72小时新发
JD基本信息
岗位职责
北京/杭州 岗位职责 1. 主导大模型推理引擎的架构设计与核心模块开发,支撑千亿参数模型的高效分布式推理。 2. 研发面向GPU/NPU等异构计算平台的高性能算子,提升硬件利用效率。 3. 参与模型低精度量化,图优化,编译优化等性能优化工作。 4. 攻克分布式推理中的动态负载均衡、通信优化、显存管理等核心技术难题。 5. 跟踪学术界与工业界前沿技术(如vLLM、TGI、TensorRT-LLM等),推进框架迭代。
任职要求
任职资格 1. 计算机、数学、电子工程、通信等相关专业本科及以上学历. 2. 熟练掌握C++/Python,具备大型项目代码架构设计能力. 3. 熟悉Transformer架构及大模型推理相关技术(如FlashAttention、PagedAttention、Continuous Batching). 4. 有实际大模型部署及调优经验,熟悉量化(INT8/FP8)等优化手段. 5. 有GPU/NPU 算子优化经验,有并行计算相关背景者优先.
所属行业:
互联网招聘
职能分类:
C++
工作城市:
北京,招聘2人,详细地址:北京海淀区弘源·新时代大厦
职位要求
学历要求:
本科·统招·一本
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
38-70万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
-
视频面试:
可以接受
为你推荐