企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
多模态表征研究员
接单
收藏职位
分享职位
30-50万
成都
研究生
不限
招聘 2 人
预计佣金
38K
09:40发布
72小时新发
JD基本信息
岗位职责
1、设计视觉-语言-物理属性的统一嵌入空间,支撑JEPA架构中的跨模态预测(如从视觉图像预测物理质量、摩擦力、弹性系数)。 2、开发基于3D Gaussian Splatting / NeRF的高效场景表征模块,支持世界模型对三维空间的实时理解与预测。 3、构建物理世界的多模态数据集(视觉+语言+物理参数+抽象概念),设计自动标注、半监督学习与数据增强管道。 4、优化视觉-语言模型(VLM)与视觉-语言-动作模型(VLA)在物理场景中的表征对齐,确保感知输出与世界模型预测空间一致。 5、开发数据飞轮系统:从仿真环境与公开数据集持续采集、清洗、标注并回流至训练管道。 6、建立“感知→表征→预测”的一致性评估指标,量化多模态嵌入空间对世界模型预测精度的贡献。
任职要求
1、硕士及以上学位,计算机视觉、多模态学习、表征学习或认知科学方向。 2、精通CLIP/LLaVA/SigLIP等视觉-语言模型,熟悉多模态Transformer架构。 3、熟悉3D视觉:NeRF、3D Gaussian Splatting、点云Transformer、PyTorch3D。 4、有大规模数据集构建经验,熟悉数据管道技术(WebDataset/Apache Beam/FiftyOne)。 5、理解表征学习的核心问题:解耦、组合性、因果性。 6、有将感知模块与世界模型/强化学习系统集成的实际经验。 7、优先条件: 1)有VLA模型或世界模型驱动感知项目经验。 2)熟悉多模态大模型微调与对齐技术(LoRA/QLoRA/RLHF/DPO)。 3)有构建物理场景理解数据集(如CLEVR、PhyRe、IntPhys)的经验。
所属行业:
人工智能AI、在线教育、培训机构、学术/科研、其他教育培训
职能分类:
算法研究员
工作城市:
成都,招聘2人,详细地址:成都市青羊区
职位要求
学历要求:
研究生·统招
工作年限:
不限
技能/证书:
-
薪资福利
年薪范围:
30-50万*15薪
薪资福利:
五险一金,双休,年假
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
-
视频面试:
可以接受
举报
为你推荐
职能类别
IT互联网技术
电子/通信/半导体
销售/客服
制药/医疗器械/医疗护理
高级管理
关于
禾蛙动态
合伙人计划
猎企入驻
帮助中心
禾蛙协议
禾蛙海外版
联系我们
电话:400-777-5125(服务时间:工作日9:00至18:00)
网址:www.hewa.cn
苏州地址:苏州工业园区星湖街328号创意产业园2-B405
北京地址:北京市朝阳区朝阳门南大街10号兆泰国际A座501
服务支持
接单方小程序
发单方小程序
微信公众号
©版权所有
苏州聚聘网络技术有限公司
苏公网安备32059002007268号
备案号:苏ICP备18067483号-3
|
营业执照
|
服务许可证