企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
推理加速工程师
接单
收藏职位
分享职位
80-100万
北京
博士
5-8年
招聘 1 人
预计佣金
130K
7天前刷新/两周前发布
迅致直营
职位亮点
知名头部国企
JD基本信息
岗位职责
1、开展高效模型结构相关探索,验证推理性能以及对模型精度的影响。 2、开展 Post-training 相关推理效率优化技术探索,包括不限于模型稀疏化、蒸馏、fast decoding 等,提升模型整体推理性能,推动在产品&开源侧落地。 3、与 LLM 预训练 & Post-training 等算法相关同学深入合作,支持团队模型相关推理效率需求,帮助团队技术落地。 4、跟进业内最新模型&技术进展,尝试&探索新的推理优化方向以及机会。 5、配合团队模型产品上线以及开源节奏,负责模型精度以及推理性能。算法系统联合优化。
任职要求
1、全日制博士毕业,计算机、软件工程、人工智能、数学等相关专业优先。 2、对 LLM 的量化、蒸馏、剪枝、稀疏化的某一项或者几项有完整的研究经历或者实际的工业界落地经验。 3、较强的动手能力,可以独立完成 idea 的验证和模型的训练。 4、熟悉常见的推理框架(例如 vLLM等),能够在 infra 上验证想法或者完成上线(偏工程需要有深入优化的能力)。 5、对技术有追求,务实,渴望做出有极大影响力的工作。 加分项 1、对 LLM 的推理有深入认知,可以做训练、推理的联合设计以提升全链路效率。 2、MLSys 方向的知名开源项目(vLLM、SGlang等)贡献者。 3、ACM 等编程竞赛获奖者。
所属行业:
通信/网络设备
职能分类:
通信研发工程师
工作城市:
北京,招聘1人,详细地址:北京
职位要求
学历要求:
博士·统招
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
80-100万*12薪
薪资福利:
五险一金
团队架构
所属部门:
研发
下属人数:
不限
部门架构:
工程师-业务负责人
汇报对象:
业务负责人
职级职称:
无
面试信息
面试轮次:
2轮
面试流程:
业务+HR
视频面试:
可以接受
举报