**********************
AI 推理框架资深研发工程师
  • 收藏职位
  • 分享职位
38-70万 北京 本科 3-5年 招聘 2 人 预计佣金 67.2K 04:27发布
72小时新发
JD基本信息
岗位职责
岗位职责 1、负责自动驾驶领域推理性能优化,针对英伟达 GPU硬件适配推理框架(TensorRT/ONNXRuntime/Triton) 2、参与图优化、算子优化、显存优化及并行策略等方案,降低模型推理延迟。 3、参与模型量化相关工具设计及开发工作。 4、与算法、工程团队协作,推动优化后的模型在实际业务中落地,提供技术支持与问题排查。
任职要求
任职资格 1、计算机、数学、电子工程、通信等相关专业本科及以上学历; 2、熟练掌握Python/C++/Cuda编程,具备扎实的算法与数据结构基础; 3、熟悉常见自动驾驶领域模型结构:如Bevfusion、Occ、Transformer、E2E等; 4、熟悉至少1种推理框架(TensorRT优先),能独立完成模型ONNX转换、算子融合、内存优化; 5、熟练掌握至少1种模型压缩技术(如量化、 剪枝、 蒸馏),并了解模型压缩后的评估机制,有实际落地案例优先; 6、了解大模型(如LLaMA、QWEN)的结构并具备车端部署经验者优先。
所属行业:
互联网招聘
职能分类:
C++
工作城市:
北京,招聘2人,详细地址:北京海淀区弘源·新时代大厦
职位要求
学历要求:
本科·统招·一本
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
38-70万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
-
视频面试:
可以接受
为你推荐