企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
大模型推理框架研发工程师(高级/资深)
接单
收藏职位
分享职位
38-70万
北京
本科
3-5年
招聘 2 人
预计佣金
67.2K
04:29发布
72小时新发
JD基本信息
岗位职责
北京/杭州 岗位职责 1. 主导大模型推理引擎的架构设计与核心模块开发,支撑千亿参数模型的高效分布式推理。 2. 研发面向GPU/NPU等异构计算平台的高性能算子,提升硬件利用效率。 3. 参与模型低精度量化,图优化,编译优化等性能优化工作。 4. 攻克分布式推理中的动态负载均衡、通信优化、显存管理等核心技术难题。 5. 跟踪学术界与工业界前沿技术(如vLLM、TGI、TensorRT-LLM等),推进框架迭代。
任职要求
任职资格 1. 计算机、数学、电子工程、通信等相关专业本科及以上学历. 2. 熟练掌握C++/Python,具备大型项目代码架构设计能力. 3. 熟悉Transformer架构及大模型推理相关技术(如FlashAttention、PagedAttention、Continuous Batching). 4. 有实际大模型部署及调优经验,熟悉量化(INT8/FP8)等优化手段. 5. 有GPU/NPU 算子优化经验,有并行计算相关背景者优先.
所属行业:
互联网招聘
职能分类:
C++
工作城市:
北京,招聘2人,详细地址:北京海淀区弘源·新时代大厦
职位要求
学历要求:
本科·统招·一本
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
38-70万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
-
视频面试:
可以接受
举报
为你推荐
职能类别
IT互联网技术
电子/通信/半导体
销售/客服
制药/医疗器械/医疗护理
高级管理
关于
禾蛙动态
合伙人计划
猎企入驻
帮助中心
禾蛙协议
禾蛙海外版
联系我们
电话:400-777-5125(服务时间:工作日9:00至18:00)
网址:www.hewa.cn
苏州地址:苏州工业园区星湖街328号创意产业园2-B405
北京地址:北京市朝阳区朝阳门南大街10号兆泰国际A座501
服务支持
接单方小程序
发单方小程序
微信公众号
©版权所有
苏州聚聘网络技术有限公司
苏公网安备32059002007268号
备案号:苏ICP备18067483号-3
|
营业执照
|
服务许可证