北京市大模型post-training框架研发专家（后训练）招聘-禾蛙,猎头合作交易平台

**********************

大模型post-training框架研发专家（后训练）

收藏职位

分享职位

60-150万北京本科 3-5年招聘 3 人预计佣金 129.6K 1天前刷新/一个月前发布

职位亮点

新增业务

JD基本信息

岗位职责

工作职责: 1.参与post-training 框架研发，聚焦 LLM + RL 方向，设计框架架构与技术路线，提升其扩展性、稳定性与效率。 2.优化框架性能，如训练速度、显存占用等，降低训练成本，为 LLM + RL 训练提供有力技术支撑。 3.协同业务团队，将 LLM 能力在业务场景落地，根据业务需求定制训练方案并评估验证模型。 4.关注行业前沿，引入有价值的技术到公司框架和模型中，探索新算法与方法，推动技术创新。

任职要求

任职资格: 1. 计算机科学、数学、统计学、自动化等相关专业本科及以上学历。 2. 熟悉Post-Training流程，深入了解RL领域，包括但不限于RM、PPO、DPO、GRPO等算法。 3.具备大模型训练框架开发能力，包括pytorch、megatron等。 4.具备强化学习框架开发能力，包括openRLHF、verl等。 5.具备一线的C++/Python工程能力，精通数据结构和常用算法，掌握各种编译、调试、性能分析工具，熟悉并行编程（CUDA/Triton等）优先。

所属行业:

O2O、移动互联网

职能分类:

算法工程师

工作城市:

北京，招聘3人，详细地址：昌平区天空之城

职位要求

学历要求:

本科·统招

工作年限:

3-5年

技能/证书:

薪资福利

年薪范围:

60-150万*15薪

薪资福利:

期权

团队架构

所属部门:

下属人数:

部门架构:

团队规模10-20人

汇报对象:

职级职称:

面试信息

面试轮次:

4轮

面试流程:

业务-交叉-HR-业务老板

视频面试:

可以接受