**********************
VLA算法总监
  • 收藏职位
  • 分享职位
200-400万 北京、深... 本科 8-10年 招聘 2 人 预计佣金 200K 5天前发布
JD基本信息
岗位职责
主导机器人视觉 - 语言 - 动作(VLA)大模型的架构设计与算法研发,突破多模态特征对齐、动作序列生成等关键技术,提升模型在复杂任务中的端到端执行能力,推动模型在泛化性、鲁棒性和效率上的突破。 设计融合视觉、语言与动作信号的联合训练框架,研发跨模态交互与理解机制,增强模型在动态环境下的语义理解、推理和决策能力;负责数据采集设计、算法架构搭建、模型训练、工程部署及持续性能优化,与硬件、数据平台、应用团队协作打造端到端解决方案。 跟踪行业和学术前沿,复现、优化并转化具身智能相关技术成果,探索 VLA 长期发展方向(如表征学习、具身智能等),参与制定公司 VLA 领域中长期技术路线图,跟踪国际顶级会议最新进展并快速原型验证。 与高校及实习生协作,提升 VLA 方向学术影响力;指导算法工程师团队,提升团队技术能力。
任职要求
计算机视觉、机器人学、自然语言处理等相关专业本科及以上学历,博士优先。 熟练掌握 PyTorch/TensorFlow 框架,精通 VLA 模型(如 RT-2、OpenVLA 等)的改进与部署,熟悉强化学习、模仿学习技术;了解多模态对齐技术(CLIP、DINOv2 等),有视觉语言模型与动作生成模块联合调优经验。 5 年以上多模态算法研发经验,主导过 VLA 相关项目(如自动驾驶、机械臂操作等)并实现商业化落地。 在 NeurIPS/ICML/CoRL 等顶级会议发表过 VLA 相关论文,或持有具身智能领域核心专利者优先。 具备较强编程能力,熟练使用 C/C++、Python,熟悉 ROS/ROS2 者优先。
所属行业:
无人机
职能分类:
技术总监
工作城市:
北京,招聘1人,详细地址:北京市石景山区首钢园深圳,招聘1人,详细地址:广东省深圳市南山区南山智园B1栋8楼
职位要求
学历要求:
本科·统招·一本
工作年限:
8-10年
技能/证书:
-
薪资福利
年薪范围:
200-400万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
2轮视频面试
视频面试:
可以接受