企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
大模型post-training框架研发专家(后训练)
接单
收藏职位
分享职位
60-150万
北京
本科
3-5年
招聘 3 人
预计佣金
129.6K
两周前发布
职位亮点
新增业务
JD基本信息
岗位职责
工作职责: 1.参与post-training 框架研发,聚焦 LLM + RL 方向,设计框架架构与技术路线,提升其扩展性、稳定性与效率。 2.优化框架性能,如训练速度、显存占用等,降低训练成本,为 LLM + RL 训练提供有力技术支撑。 3.协同业务团队,将 LLM 能力在业务场景落地,根据业务需求定制训练方案并评估验证模型。 4.关注行业前沿,引入有价值的技术到公司框架和模型中,探索新算法与方法,推动技术创新。
任职要求
任职资格: 1. 计算机科学、数学、统计学、自动化等相关专业本科及以上学历。 2. 熟悉Post-Training流程,深入了解RL领域,包括但不限于RM、PPO、DPO、GRPO等算法。 3.具备大模型训练框架开发能力,包括pytorch、megatron等。 4.具备强化学习框架开发能力,包括openRLHF、verl等。 5.具备一线的C++/Python工程能力,精通数据结构和常用算法,掌握各种编译、调试、性能分析工具,熟悉并行编程(CUDA/Triton等)优先。
所属行业:
O2O、移动互联网
职能分类:
算法工程师
工作城市:
北京,招聘3人,详细地址:昌平区天空之城
职位要求
学历要求:
本科·统招
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
60-150万*15薪
薪资福利:
期权
团队架构
所属部门:
-
下属人数:
-
部门架构:
团队规模10-20人
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
业务-交叉-HR-业务老板
视频面试:
可以接受
举报