**********************
大模型部署工程师
  • 收藏职位
  • 分享职位
40-70万 北京、南... 本科 5-8年 招聘 2 人 预计佣金 84K 2天前刷新/3天前发布
JD基本信息
岗位职责
工作职责:(先加微信:duke-simon 拿项目手册,画像精准再做单) 1. 参与大模型端侧部署工作 2. 参与大模型的量化优化、推理加速等性能优化工作 岗位要求: 3. 熟练使用c++、python 4. 有大模型的开发经验,熟悉大模型的相关基础 5. 熟悉大模型加速技术,如kv cache、模型量化、flash-attention、推理并行、投机采样等 加分项: 6. 熟悉常见一种开源社区的大模型推理框架,如vllm、tensorrt-llm、lmdeploy、llama.cpp等 7. 有ai编译器开发、算子开发经验 8. 有大模型推理加速经验 9. 有vlm云端或端侧部署经验者优先
任职要求
工作职责: 1. 参与大模型端侧部署工作 2. 参与大模型的量化优化、推理加速等性能优化工作 岗位要求: 3. 熟练使用c++、python 4. 有大模型的开发经验,熟悉大模型的相关基础 5. 熟悉大模型加速技术,如kv cache、模型量化、flash-attention、推理并行、投机采样等 加分项: 6. 熟悉常见一种开源社区的大模型推理框架,如vllm、tensorrt-llm、lmdeploy、llama.cpp等 7. 有ai编译器开发、算子开发经验 8. 有大模型推理加速经验 9. 有vlm云端或端侧部署经验者优先
所属行业:
其他制造业
职能分类:
其他
工作城市:
北京,招聘1人,详细地址:。南京,招聘1人,详细地址:。
职位要求
学历要求:
本科
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
40-70万*14薪
薪资福利:
团队架构
所属部门:
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
视频面试:
不可以接受