企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
AI高阶工程-大模型推理
接单
收藏职位
分享职位
150-250万
北京
研究生
10年及以上
招聘 2 人
预计佣金
260K
4天前发布
迅致直营
JD基本信息
岗位职责
1. 负责大规模预训练模型(如GPT、BERT、LLM等)的推理系统设计、优化与落地,实现模型在多平台(GPU、CPU、NPU等)上的高效推理。 2. 针对模型推理场景,深入分析性能瓶颈,主导模型量化、剪枝、蒸馏、结构重参数化等前沿推理加速技术的研究与应用。 3. 参与大模型推理框架(如TensorRT、ONNX Runtime、OpenVINO、MindSpore等)的开发与优化,提升推理效率与系统稳定性。 4. 跟踪业界和学术界大模型推理相关前沿技术,推动创新方案在业务中的应用落地。 5. 与算法、系统、硬件等团队紧密协作,制定端到端的推理优化方案,支撑业务高并发、低延迟的需求。 6. 负责推理平台的技术难点攻关,解决模型部署、兼容性、资源调度等实际问题。
任职要求
1. 计算机、人工智能、电子工程等相关专业硕士及以上学历,5年以上AI推理/系统优化相关工作经验。 2. 深入理解主流大模型结构及推理原理,熟悉Transformer、LLM等模型的高效推理优化技术。 3. 精通至少一种主流深度学习框架(如PyTorch、TensorFlow、MindSpore等)及其推理引擎(如TensorRT、ONNX Runtime等)。 4. 熟悉模型压缩、量化、剪枝、蒸馏等加速技术,并有实际落地经验。 5. 扎实的编程能力,精通C++/Python,具备良好的系统调优与性能分析能力。 6. 有大规模分布式推理、异构计算(GPU/CPU/NPU)或端侧推理部署经验者优先。 7. 具备良好的团队协作、沟通能力和创新精神,能承担复杂项目的技术攻关任务。 8. 有相关开源项目贡献、顶会论文发表或大模型推理产品化经验者优先。
所属行业:
电子商务
职能分类:
深度学习
工作城市:
北京,招聘2人,详细地址:北京市朝阳区望京东路4号院恒电大厦
职位要求
学历要求:
研究生·统招
工作年限:
10年及以上
技能/证书:
-
薪资福利
年薪范围:
150-250万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
举报