企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
大模型Infra工程师
接单
收藏职位
分享职位
80-120万
北京
本科
5-8年
招聘 1 人
预计佣金
122.5K
04:55发布
72小时新发
JD基本信息
岗位职责
职位描述 1.、负责大模型推理/训练效率优化,涵盖算法研发与工程落地:包括量化(INT4/INT8/FP8)、剪枝、蒸馏、低秩适配(LoRA/QLoRA)、注意力机制优化(FlashAttention/PagedAttention)等算法的设计与实现,同时完成工程化封装; 2、研究并落地大模型分布式训练/推理策略,包括数据并行、模型并行(张量/流水线/专家并行)、混合并行的高效实现,解决分布式场景下的性能瓶颈与稳定性问题; 3、参与大模型编译优化与工程适配,基于TVM/TensorRT/MLIR等框架做模型图优化、算子融合、硬件定制化算子开发,同时完成与训练/推理平台的对接适配; 4、负责大模型训练/推理平台的核心模块研发与维护,包括训练任务调度、推理服务部署、资源监控、日志分析等,基于vLLM/TGI/TensorRT-LLM等主流引擎进行二次开发和平台化封装; 5、研发大模型Infra通用工具链,包括模型转换、模型校验、性能测试、监控告警等,提升团队研发效率与线上服务可靠性; 6、与业务、硬件团队协作,完成大模型基础设施在异构硬件(GPU/NPU/TPU)上的适配与部署,保障线上推理服务SLA,快速定位并解决线上性能抖动、资源耗尽等问题; 7、资深岗需带领小团队完成核心优化方向的技术攻坚,制定技术路线,输出技术规范和最佳实践,推动跨团队技术协作。
任职要求
职位要求 1、计算机科学、软件工程、电子信息、数学等相关专业,研究生及以上学历,1-3年以上深度学习/大模型/分布式系统相关研发经验; 2、扎实的编程基础,精通Python/C/C++,熟悉Go者优先,熟悉至少一种主流深度学习框架(PyTorch/TensorFlow/MXNet),理解框架底层原理; 3、深入理解Transformer架构及大模型核心原理,熟悉大模型训练/推理的关键瓶颈与优化思路,具备至少一种大模型优化技术(量化/剪枝/分布式并行/编译优化)的实践经验; 4、熟悉分布式系统原理,了解微服务架构,有服务端高可用、高并发开发经验,熟悉至少一种容器/编排技术(Docker/K8s); 5、了解异构硬件(GPU/A100/H100/NPU/TPU)的架构特点,熟悉硬件相关的性能调优方法,了解GPU资源监控与调优工具(如nvidia-smi/prometheus/grafana)者优先; 6、具备良好的问题分析与排查能力、工程实现能力和跨团队协作能力,能独立负责核心模块的研发与落地。 加分项 1、有大模型推理引擎(vLLM/TGI/TensorRT-LLM)的开发、二次开发或部署调优经验; 2、有FP8/INT4量化在GPT/LLaMA/Qwen等主流大模型上的落地经验,或参与过千亿级以上参数模型的训练/推理优化项目; 3、有TVM/MLIR/TensorRT等编译框架的使用或开发经验,具备定制化算子开发能力; 4、有K8s自定义算子/调度器开发经验,或云原生AI平台(Kubeflow/MLflow)研发经验; 5、有大模型训练平台(Megatron-LM/DeepSpeed)的使用或部署经验,熟悉消息队列(Kafka/RabbitMQ)、缓存(Redis)等中间件的使用与调优; 6、资深岗候选人有顶会/顶刊论文(NeurIPS/ICML/ICLR/AAAI)或专利产出者优先。 资深岗额外要求 1、5年以上大模型Infra/深度学习框架/分布式系统相关研发经验,有千亿级以上参数大模型基础设施建设的核心项目经验; 2、主导过至少一个大模型优化方向的技术攻坚(如推理性能提升/训练成本降低),并取得显著业务效果(如时延降低30%+/成本降低40%+); 3、深入理解至少一种分布式计算框架(MPI/NCCL/OneFlow/PaddlePaddle)的底层实现,具备技术团队管理与技术路线规划能力。
所属行业:
人工智能AI
职能分类:
算法工程师
工作城市:
北京,招聘1人,详细地址:北辰空间
职位要求
学历要求:
本科·统招·一本
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
80-120万*15薪
薪资福利:
40-80k
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
4轮业务+1轮hr
视频面试:
可以接受
举报
为你推荐
职能类别
IT互联网技术
电子/通信/半导体
销售/客服
制药/医疗器械/医疗护理
高级管理
关于
禾蛙动态
合伙人计划
猎企入驻
帮助中心
禾蛙协议
禾蛙海外版
联系我们
电话:400-777-5125(服务时间:工作日9:00至18:00)
网址:www.hewa.cn
苏州地址:苏州工业园区星湖街328号创意产业园2-B405
北京地址:北京市朝阳区朝阳门南大街10号兆泰国际A座501
服务支持
接单方小程序
发单方小程序
微信公众号
©版权所有
苏州聚聘网络技术有限公司
苏公网安备32059002007268号
备案号:苏ICP备18067483号-3
|
营业执照
|
服务许可证