**********************
大模型工程化部署
  • 收藏职位
  • 分享职位
60-80万 武汉 本科 10年及以上 招聘 1 人 预计佣金 58.2K 02:26刷新/一周前发布
JD基本信息
岗位职责
1.负责大模型在企业级场景下的工程化落地,包括模型压缩、量化、蒸馏、分布式训练与推理优化等技术实现; 2.设计并搭建大模型部署基础设施(如GPU集群管理、容器化部署、边缘计算适配),保障高并发、低延迟、高可用的生产环境运行; 3.协同算法团队完成模型与业务系统的集成,解决端到端部署中的性能瓶颈(如内存占用、响应时间、成本优化); 4,跟踪大模型工程化前沿技术(如MoE架构、动态批处理、混合精度推理),推动技术迭代与创新; 5.制定大模型部署规范与运维标准,输出技术文档并培养团队工程化能力。
任职要求
1.8年及以上大模型或深度学习模型工程化经验,主导过至少2个百万级以上参数模型的规模化部署项目; 2.精通Python/C++,熟悉TensorRT、ONNX Runtime、vLLM等推理框架,掌握Docker/K8s容器化技术及云平台(AWS/GCP/阿里云)部署; 3.深入理解大模型训练/推理全流程(数据预处理、模型并行、流水线并行、显存优化),具备分布式系统调优经验; 。有汽车行业大模型部署经验者优先(如车载语音交互、智能座舱、自动驾驶感知模型)。
所属行业:
人工智能AI
职能分类:
智能驾驶系统工程师
工作城市:
武汉,招聘1人,详细地址:武汉市蔡甸区珠山湖大道663号
职位要求
学历要求:
本科·统招·985/211
工作年限:
10年及以上
技能/证书:
-
薪资福利
年薪范围:
60-80万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
为你推荐