**********************
多模态表征研究员
  • 收藏职位
  • 分享职位
30-50万 成都 研究生 不限 招聘 2 人 预计佣金 38K 09:40发布
72小时新发
JD基本信息
岗位职责
1、设计视觉-语言-物理属性的统一嵌入空间,支撑JEPA架构中的跨模态预测(如从视觉图像预测物理质量、摩擦力、弹性系数)。 2、开发基于3D Gaussian Splatting / NeRF的高效场景表征模块,支持世界模型对三维空间的实时理解与预测。 3、构建物理世界的多模态数据集(视觉+语言+物理参数+抽象概念),设计自动标注、半监督学习与数据增强管道。 4、优化视觉-语言模型(VLM)与视觉-语言-动作模型(VLA)在物理场景中的表征对齐,确保感知输出与世界模型预测空间一致。 5、开发数据飞轮系统:从仿真环境与公开数据集持续采集、清洗、标注并回流至训练管道。 6、建立“感知→表征→预测”的一致性评估指标,量化多模态嵌入空间对世界模型预测精度的贡献。
任职要求
1、硕士及以上学位,计算机视觉、多模态学习、表征学习或认知科学方向。 2、精通CLIP/LLaVA/SigLIP等视觉-语言模型,熟悉多模态Transformer架构。 3、熟悉3D视觉:NeRF、3D Gaussian Splatting、点云Transformer、PyTorch3D。 4、有大规模数据集构建经验,熟悉数据管道技术(WebDataset/Apache Beam/FiftyOne)。 5、理解表征学习的核心问题:解耦、组合性、因果性。 6、有将感知模块与世界模型/强化学习系统集成的实际经验。 7、优先条件: 1)有VLA模型或世界模型驱动感知项目经验。 2)熟悉多模态大模型微调与对齐技术(LoRA/QLoRA/RLHF/DPO)。 3)有构建物理场景理解数据集(如CLEVR、PhyRe、IntPhys)的经验。
所属行业:
人工智能AI、在线教育、培训机构、学术/科研、其他教育培训
职能分类:
算法研究员
工作城市:
成都,招聘2人,详细地址:成都市青羊区
职位要求
学历要求:
研究生·统招
工作年限:
不限
技能/证书:
-
薪资福利
年薪范围:
30-50万*15薪
薪资福利:
五险一金,双休,年假
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
-
视频面试:
可以接受
为你推荐