**********************
研发专家(大模型推理引擎优化方向)
  • 收藏职位
  • 分享职位
30-100万 北京 本科 8-10年 招聘 1 人 预计佣金 124.2K 09:43发布
72小时新发
JD基本信息
岗位职责
1.负责大模型推理引擎的架构设计、核心模块研发及整体性能调优; 2.开展编译、通信和图优化计算等技术优化,解决并发及高模型推理中的瓶颈问题; 3.设计并实现多维度并行化推理方案,结合内存、任务调度与 KV Cache 管理,提升系统整体吞吐量与稳定性; 4.与业务、算法及产品团队紧密合作,参与需求评审与系统联合优化,确保技术方案满足实际业务场景; 5.跟踪国内外大模型推理技术动态,评估并引入具有前瞻性的优化方案,持续提升产品竞争力。
任职要求
1.大学本科及以上学历,并取得相应学位,计算机及相关专业,具备扎实的计算机基础知识; 2.具备 8 年及以上工作经验,熟练使用 C/C++ 和 Python 语言,具备扎实的软件开发和设计经验; 3.深入理解 Transformer 架构,熟悉多种多模态及通用 AI 模型,掌握至少一种机器学习推理框架(如 TensorRT、ONNXRuntime、vLLM、SGLang、TensorRT-LLM 或其他推理框架); 4.具备机器学习模型、异构并行计算、分布式存储、高性能网络或云计算中至少一项的知识和开发经验; 5.熟悉性能建模、性能分析与优化,或有 GPU/CPU 相关调优经验; 6.诚实守信、作风踏实严谨、责任心强,具备良好团队协作能力精神,学习能力强,善于解决复杂问题。
所属行业:
通信/网络设备、芯片、运营商/增值服务
职能分类:
技术总监
工作城市:
北京,招聘1人,详细地址:西城区
职位要求
学历要求:
本科·统招·985/211
工作年限:
8-10年
技能/证书:
-
薪资福利
年薪范围:
30-100万*12薪
薪资福利:
各级别都需要
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
为你推荐