**********************
强化学习
  • 收藏职位
  • 分享职位
60-100万 苏州 研究生 3-5年 招聘 1 人 预计佣金 104K 3天前发布
迅致直营 72小时新发
JD基本信息
岗位职责
一、岗位定位 设计并研发基于深度学习和强化学习的足式(特别是人形)机器人运动控制与感知算法。聚焦于复杂动态环境下的稳定运动、敏捷操作和鲁棒环境交互(如避障、复杂地形行走、抗干扰等)。 二、核心职责 运动控制算法开发与优化: 负责前沿足式机器人运控算法的开发与实机优化,熟练掌握 Model-free RL, Model-based RL, Offline RL 等强化学习算法及其在机器人控制中的应用。 仿真-现实迁移技术(Sim-to-Real): 构建并维护高保真物理仿真环境(如MuJoCo/Isaac Sim/Isaac Gym),设计并实施高效的 Domain Randomization 和适配策略,解决Sim-to-Real鸿沟问题,确保算法快速落地。 系统集成与部署优化: 负责RL算法在高性能嵌入式平台(如Jetson Orin/NVIDIA Thor)上的实时性优化和部署。与硬件团队紧密协作,设计并实现传感器(视觉/力觉/IMU)-控制器-执行器的低延迟、高鲁棒性闭环反馈控制系统。 机器人动力学建模与优化: 深刻理解并掌握足式机器人运动学、动力学知识,能够准确进行机器人本体建模、状态估计和控制力矩分配,优化算法的物理可实现性。
任职要求
三、任职要求 硕士及以上学历,人工智能 / 机器人学 / 自动化 / 控制工程等相关专业。具备 1-3 年人形/足式机器人运控算法训练与实机部署一线实操经验者优先。 核心要求: 强化学习与控制理论:精通深度强化学习算法(如PPO、SAC、DQN等)及其在连续控制任务中的应用。具备扎实的运动控制、轨迹优化、状态估计等经典机器人控制理论基础。 **工程实践与部署:**熟练使用 PyTorch ,具备优秀的 Python/C++ 编程和代码优化能力。熟悉 ROS/ROS2 机器人开发框架和Linux系统。具备将强化学习策略部署到实际机器人硬件平台的经验。 仿真与迁移技术:精通物理仿真工具链(如MuJoCo, Isaac Sim, Isaac Gym)进行策略训练和调试。对Sim-to-Real迁移技术有深入理解和实战经验。
所属行业:
人工智能AI
职能分类:
算法工程师
工作城市:
苏州,招聘1人,详细地址:吴中区
职位要求
学历要求:
研究生·985/211
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
60-100万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
3轮
面试流程:
-
视频面试:
可以接受