企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
大模型异构推理优化技术专家-AI领域-北京/杭州/上海
接单
收藏职位
分享职位
70-90万
北京
研究生
3-5年
招聘 1 人
预计佣金
135K
10:42刷新/09:58发布
迅致直营
72小时新发
JD基本信息
岗位职责
岗位描述 ● 面向 NVIDIA GPU、AMD GPU、NPU 等主流异构 AI 加速硬件,对大模型核心算子进行深度性能优化,极致压榨计算与访存带宽资源,显著提升端到端推理吞吐量与延迟表现。 ● 设计并实现高精度、极低比特(如 INT4/INT2)量化内核,在保障推理精度的前提下,大幅降低模型存储占用与计算开销,推动大模型在资源受限场景下的高效部署。 ● 针对大规模分布式推理场景,研发计算-通信协同优化技术,有效隐藏通信延迟,提升多卡/多节点系统的可扩展性与资源利用率。 ● 紧跟大模型架构前沿演进,针对稀疏 MoE、线性注意力(Linear Attention)、稀疏注意力(Sparse Attention)等新型结构,开展端到端性能建模、算子定制与内核级优化,为下一代高性能推理引擎提供核心技术支撑。
任职要求
岗位要求 ● 具备扎实的工程实现能力与良好的代码规范,熟练掌握 Python 和 C++,熟悉常用设计模式,能够独立完成复杂系统的架构设计、开发与调试。 ● 拥有丰富的高性能计算内核(Kernel)开发经验,精通 CUDA / Triton / ROCm 等异构编程模型,有基于 CUTLASS、CUTE 等框架进行算子开发与极致性能调优的实战经验,并已在生产环境中成功落地。 ● 熟悉计算机体系结构核心原理,具备大模型推理引擎(如 vLLM、SGLang 等)优化经验,或在模型压缩(如低比特量化、稀疏化)、AI资源调度、计算图优化等方向有深入实践。 ● 具备优秀的沟通协作能力与团队合作精神,学习能力强,对技术有热情,能深入钻研底层性能瓶颈并提出创新性解决方案。
所属行业:
云计算
职能分类:
技术经理
工作城市:
北京,招聘1人,详细地址:中国-北京
职位要求
学历要求:
研究生
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
70-90万*13薪
薪资福利:
P7底薪+绩效+奖金+股票
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
一面:部门高级别同事电话沟通---二面:部门leader 线下--三面:线上交叉面--四面:HR
视频面试:
不可以接受
举报