北京市G-大模型推理工程师/专家-LLM/语音方向招聘-禾蛙,猎头合作交易平台

**********************

G-大模型推理工程师/专家-LLM/语音方向

收藏职位

分享职位

40-80万北京研究生 3-5年招聘 2 人预计佣金 72K 1天前发布

72小时新发

职位亮点

大厂福利待遇

JD基本信息

岗位职责

岗位描述 1.负责语言大模型(LLM)、语音生成模型、SpeechLM等推理优化加速，通过量化压缩、算子融合、动态批处理等技术，优化推理延迟2.负责高性能推理框架设计，支持多模型混合部署(如LLM+TTS联合推理)，优化GPU/NPU资源利用率。3.负责音频生成模型工程化落地，优化音频生成模型的推理管线，解决内存占用高、流式生成卡顿等问题。开发多模态生成链路，优化跨模型数据传输与计算资源调度,4.负责构建模型推理监控系统，实时追踪推理指标，设计A/B测试框架验证优化效果。

任职要求

岗位要求 1.计算机相关专业，硕士优先，3年以上模型推理、部署经验。主导过LLM或音视频生成模型的工程化落地项目2.熟练使用C++/Python，掌握Triton/TensorRT Serving等推理框架二次开发。3.精通PyTorch/Tensorflow模型优化技术(量化/剪枝/蒸馏)，熟悉ONNX模型转换与加速，精通CUDA编程与GPU性能调优4.熟悉大模型微调与推理加速联合优化，参与过开源推理框架(如VLLM、FastTransformer、DeepSpeed)核心开发者优先。5.具备优秀的团队协作与沟通能力，能协调跨部门资源推进项目。

所属行业:

人工智能AI、互联网类其他

职能分类:

算法工程师

工作城市:

北京，招聘2人，详细地址：望京

职位要求

学历要求:

研究生·统招·985/211

工作年限:

3-5年

技能/证书:

薪资福利

年薪范围:

40-80万*16薪

薪资福利:

大厂福利待遇

团队架构

所属部门:

略

下属人数:

部门架构:

略

汇报对象:

略

职级职称:

6-7

面试信息

面试轮次:

4轮

面试流程:

具体情况根据企业要求定

视频面试:

可以接受