**********************
G-大模型推理工程师/专家-LLM/语音方向
  • 收藏职位
  • 分享职位
40-80万 北京 研究生 3-5年 招聘 2 人 预计佣金 72K 1天前发布
72小时新发
职位亮点
大厂福利待遇
JD基本信息
岗位职责
岗位描述 1.负责语言大模型(LLM)、语音生成模型、SpeechLM等推理优化加速,通过量化压缩、算子融合、动态批处理等技术,优化推理延迟2.负责高性能推理框架设计,支持多模型混合部署(如LLM+TTS联合推理),优化GPU/NPU资源利用率。3.负责音频生成模型工程化落地,优化音频生成模型的推理管线,解决内存占用高、流式生成卡顿等问题。开发多模态生成链路,优化跨模型数据传输与计算资源调度,4.负责构建模型推理监控系统,实时追踪推理指标,设计A/B测试框架验证优化效果。
任职要求
岗位要求 1.计算机相关专业,硕士优先,3年以上模型推理、部署经验。 主导过LLM或音视频生成模型的工程化落地项目2.熟练使用C++/Python,掌握Triton/TensorRT Serving等推理框架二次开发。3.精通PyTorch/Tensorflow模型优化技术(量化/剪枝/蒸馏),熟悉ONNX模型转换与加速,精通CUDA编程与GPU性能调优4.熟悉大模型微调与推理加速联合优化,参与过开源推理框架(如VLLM、FastTransformer、DeepSpeed)核心开发者优先。5.具备优秀的团队协作与沟通能力,能协调跨部门资源推进项目。
所属行业:
人工智能AI、互联网类其他
职能分类:
算法工程师
工作城市:
北京,招聘2人,详细地址:望京
职位要求
学历要求:
研究生·统招·985/211
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
40-80万*16薪
薪资福利:
大厂福利待遇
团队架构
所属部门:
下属人数:
-
部门架构:
汇报对象:
职级职称:
6-7
面试信息
面试轮次:
4轮
面试流程:
具体情况根据企业要求定
视频面试:
可以接受