上海市具身强化学习算法工程师（真机 RL 方向）招聘-禾蛙,猎头合作交易平台

**********************

具身强化学习算法工程师（真机 RL 方向）

收藏职位

分享职位

20-60万上海研究生不限招聘 5 人预计佣金 55.7K 两周前刷新/三周前发布

反馈快

JD基本信息

岗位职责

1.VTLA（VLA+触觉）闭环策略优化：利用 RL 微调大模型，实现高精度动作执行与物理反馈闭环。 2.真机强化学习训练：在真实机器人平台上设计并实施 RL 方案，提升泛化能力与鲁棒性。 3.多模态反馈对齐：利用触觉、视觉、运动状态数据，解决灵巧操作难题。 4. 奖励函数与策略对齐：针对长程任务设计高效奖励函数。

任职要求

博士/硕士优先，深刻理解 PPO/TD3 等 RL 算法，熟悉 LLM/VLM 训练逻辑；具备机器人运动学/动力学基础；精通 Python/PyTorch，有分布式训练与真机部署经验 6.加分项：触觉传感器+RL 项目经验；VLA 实战经历；顶会论文（CoRL/ICRA/IROS/RSS/NeurIPS）；熟练使用 Claude Code、 Cursor 等。

所属行业:

工业机器人

职能分类:

算法工程师

工作城市:

上海，招聘5人，详细地址：上海市静安区江场三路228号911号

职位要求

学历要求:

研究生·统招·一本

工作年限:

不限

技能/证书:

薪资福利

年薪范围:

20-60万*15薪

薪资福利:

团队架构

所属部门:

下属人数:

部门架构:

汇报对象:

职级职称:

面试信息

面试轮次:

3轮

面试流程:

2-3面，可以接受视频面试

视频面试:

可以接受

职能类别

关于

联系我们

电话：400-777-5125（服务时间：工作日9:00至18:00）
网址：www.hewa.cn
苏州地址：苏州工业园区星湖街328号创意产业园2-B405
北京地址：北京市朝阳区朝阳门南大街10号兆泰国际A座501

服务支持: 接单方小程序

发单方小程序

微信公众号