**********************
推理系统专家(芯片)
  • 收藏职位
  • 分享职位
60-100万 北京、上... 研究生 10年及以上 招聘 4 人 预计佣金 150K 三周前刷新/一个月前发布
JD基本信息
岗位职责
"职位描述: 1、作为推理系统领域带头人,深刻洞察业界推理优化算法和推理架构设计领域的发展趋势,负责推理算法和推理产品架构设计,构建公司高性价比推理平台关键能力,使能公司在该领域的商业成功。 2、面向公司LLM、视觉、多模态、具身智能模型等主流应用和主力推理芯片,带领团队构建高性价比单卡、单机和集群推理软件栈架构能力,提高推理速度、吞吐和利用率,推动新型推理架构和推理性能工程优化的技术落地; 3、培养推理系统技术专家梯队与技术骨干梯队。 任职要求: 1、硕士学位或博士学位,在分布式并行计算和AI领域有10年以上的研发经验; 2、精通大模型推理的软件架构,具有TensorRT-LLM、VLLM、SGLANG等推理软件栈的架构设计经验 3、精通大模型的常用模型结构,在LLM、文生图、多模态等领域的大模型推理具有深厚的技术积累, 4、熟悉NPU等AI加速器的硬件架构和编程体系,具有软硬芯协同的AI系统优化的经验。 5、熟悉集群计算和云计算领域,具有集群调度的软件架构设计经验。"
任职要求
"职位描述: 1、作为推理系统领域带头人,深刻洞察业界推理优化算法和推理架构设计领域的发展趋势,负责推理算法和推理产品架构设计,构建公司高性价比推理平台关键能力,使能公司在该领域的商业成功。 2、面向公司LLM、视觉、多模态、具身智能模型等主流应用和主力推理芯片,带领团队构建高性价比单卡、单机和集群推理软件栈架构能力,提高推理速度、吞吐和利用率,推动新型推理架构和推理性能工程优化的技术落地; 3、培养推理系统技术专家梯队与技术骨干梯队。 任职要求: 1、硕士学位或博士学位,在分布式并行计算和AI领域有10年以上的研发经验; 2、精通大模型推理的软件架构,具有TensorRT-LLM、VLLM、SGLANG等推理软件栈的架构设计经验 3、精通大模型的常用模型结构,在LLM、文生图、多模态等领域的大模型推理具有深厚的技术积累, 4、熟悉NPU等AI加速器的硬件架构和编程体系,具有软硬芯协同的AI系统优化的经验。 5、熟悉集群计算和云计算领域,具有集群调度的软件架构设计经验。"
所属行业:
芯片
职能分类:
芯片架构设计师
工作城市:
北京,招聘1人,详细地址:北京市海淀区知春路27号量子芯座8层上海,招聘1人,详细地址:上海市浦东新区郭守敬路498号西侧1号楼2层成都,招聘1人,详细地址:成都市高新区天府大道1199号银泰中心2号写字楼26层长沙,招聘1人,详细地址:湖南省长沙市开福区东风路街道芙蓉中路一段303号富兴·世界金融中心T2栋22层
职位要求
学历要求:
研究生·统招
工作年限:
10年及以上
技能/证书:
-
薪资福利
年薪范围:
60-100万*12薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
2-3轮面试
视频面试:
可以接受