成都市多模态表征研究员招聘-禾蛙,猎头合作交易平台

**********************

多模态表征研究员

收藏职位

分享职位

30-50万成都研究生不限招聘 2 人预计佣金 38K 一周前刷新/一个月前发布

JD基本信息

岗位职责

1、设计视觉-语言-物理属性的统一嵌入空间，支撑JEPA架构中的跨模态预测（如从视觉图像预测物理质量、摩擦力、弹性系数）。 2、开发基于3D Gaussian Splatting / NeRF的高效场景表征模块，支持世界模型对三维空间的实时理解与预测。 3、构建物理世界的多模态数据集（视觉+语言+物理参数+抽象概念），设计自动标注、半监督学习与数据增强管道。 4、优化视觉-语言模型（VLM）与视觉-语言-动作模型（VLA）在物理场景中的表征对齐，确保感知输出与世界模型预测空间一致。 5、开发数据飞轮系统：从仿真环境与公开数据集持续采集、清洗、标注并回流至训练管道。 6、建立“感知→表征→预测”的一致性评估指标，量化多模态嵌入空间对世界模型预测精度的贡献。

任职要求

1、硕士及以上学位，计算机视觉、多模态学习、表征学习或认知科学方向。 2、精通CLIP/LLaVA/SigLIP等视觉-语言模型，熟悉多模态Transformer架构。 3、熟悉3D视觉：NeRF、3D Gaussian Splatting、点云Transformer、PyTorch3D。 4、有大规模数据集构建经验，熟悉数据管道技术（WebDataset/Apache Beam/FiftyOne）。 5、理解表征学习的核心问题：解耦、组合性、因果性。 6、有将感知模块与世界模型/强化学习系统集成的实际经验。 7、优先条件： 1）有VLA模型或世界模型驱动感知项目经验。 2）熟悉多模态大模型微调与对齐技术（LoRA/QLoRA/RLHF/DPO）。 3）有构建物理场景理解数据集（如CLEVR、PhyRe、IntPhys）的经验。

所属行业:

人工智能/大模型/算力、在线教育、培训/辅导机构、学术/科研、职业教育/培训

职能分类:

算法研究员

工作城市:

成都，招聘2人，详细地址：成都市青羊区

职位要求

学历要求:

研究生·统招

工作年限:

不限

技能/证书:

薪资福利

年薪范围:

30-50万*15薪

薪资福利:

五险一金，双休，年假

团队架构

所属部门:

下属人数:

部门架构:

汇报对象:

职级职称:

面试信息

面试轮次:

2轮

面试流程:

视频面试:

可以接受

职能类别

关于

联系我们

电话：400-777-5125（服务时间：工作日9:00至18:00）
网址：www.hewa.cn
地址：中国（上海）自由贸易试验区滨江大道99弄6号第11层

服务支持: 接单方小程序

发单方小程序

微信公众号