**********************
具身强化学习算法工程师(真机 RL 方向)
  • 收藏职位
  • 分享职位
20-60万 上海 研究生 不限 招聘 5 人 预计佣金 55.7K 01:38发布
72小时新发
JD基本信息
岗位职责
1.VTLA(VLA+触觉)闭环策略优化:利用 RL 微调大模型, 实现高精度动作执行与物理反馈闭环。 2.真机强化学习训练:在真实机器人平台上设计并实施 RL 方案,提升泛化能力与鲁棒性。 3.多模态反馈对齐:利用触觉、视觉、运动状态数据,解决 灵巧操作难题。 4. 奖励函数与策略对齐:针对长程任务设计高效奖励函数。
任职要求
博士/硕士优先,深刻理解 PPO/TD3 等 RL 算法, 熟悉 LLM/VLM 训练逻辑;具备机器人运动学/动力学基础;精 通 Python/PyTorch,有分布式训练与真机部署经验 6.加分项:触觉传感器+RL 项目经验;VLA 实战经历;顶会 论文(CoRL/ICRA/IROS/RSS/NeurIPS);熟练使用 Claude Code、 Cursor 等。
所属行业:
工业机器人
职能分类:
算法工程师
工作城市:
上海,招聘5人,详细地址:上海市静安区江场三路228号911号
职位要求
学历要求:
研究生·统招·一本
工作年限:
不限
技能/证书:
-
薪资福利
年薪范围:
20-60万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
3轮
面试流程:
2-3面,可以接受视频面试
视频面试:
可以接受
为你推荐