**********************
研发专家(大模型推理引擎工程方向)
  • 收藏职位
  • 分享职位
30-100万 北京 本科 8-10年 招聘 1 人 预计佣金 124.2K 2天前刷新/两周前发布
JD基本信息
岗位职责
1.研发及优化语言大模型及多模态等推理引擎、PD 分离推理调度系统; 2.支持新一代自研 AI 芯片推理引擎 / 优化,为优化模型推理性能,打造行业优势; 3.优化大模型 KV Cache 命中率,从推理框架、流量调度、多模型缓存等多个系统维度入手定制优化策略; 4.优化数据的预取策略,充分利用计算侧的高带宽,利用 NPU、RDMA 通信等降低 GPU Direct 技术实现数据的高效传输; 5.跟踪国内外大模型推理技术动态,评估并引入具有前瞻性的优化方案,持续提升产品竞争力。
任职要求
1.大学本科及以上学历,并取得相应学位,计算机及相关专业优先; 2.具备 6 年及以上工作经验,熟练掌握 C/C++、Python 编程语言,具备良好的 coding 和调试能力; 3.熟悉 PyTorch/TensorRT-LLM/vLLM/SGLang 等大模型推理框架,具备 CUDA、算子优化、KV Cache、量化(INT4/INT8)、批处理、连续批处理(Continuous Batching)或分布式推理实践经验; 4.熟悉各类模型学习网络和算子底层实现细节,训练和推理模型调试、调优有实践经验优先; 5.熟悉并行策略,如模型并行、流水线并行等,了解 NVLINK、GPU 直接通信优化; 6.具备 GPU、AI 芯片体系结构知识,熟悉芯片特性,具备系统性能分析和调优经验优先; 7.诚实守信、作风踏实严谨、责任心强,具备良好团队协作能力精神,学习能力强,善于解决复杂问题。
所属行业:
物联网、工业互联网、通信/网络设备、运营商/增值服务
职能分类:
技术总监
工作城市:
北京,招聘1人,详细地址:西城区
职位要求
学历要求:
本科·统招·985/211
工作年限:
8-10年
技能/证书:
-
薪资福利
年薪范围:
30-100万*12薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
为你推荐