**********************
多模态大模型算法研究员(视觉预训练方向)
  • 收藏职位
  • 分享职位
50-100万 杭州 研究生 5-8年 招聘 1 人 预计佣金 100K 09:22发布
72小时新发
JD基本信息
岗位职责
核心职责:负责构建和优化医疗垂域的视觉基础模型(Encoder),利用海量医学影像数据进行自监督学习,以提取能够适应不同模态CT/MRI/病理等)的高质量通用视觉特征。 VLM,图像理解,视觉文本方向 岗位职责: 1、参与大规模 VLM 模型的训练与优化,涵盖图文匹配、跨模态生成、多模态问答等任务。 2、负责训练管线搭建与优化,包括 分布式训练、显存优化、混合精度、梯度检查点 等。 3、深入研究并实现前沿多模态算法(CLIP、BLIP、LLaVA、InternVL、Qwen-VL 等),推动团队模型能力持续进化。 4、 参与 数据管线建设:从数据清洗、样本混合、指令模板设计,到训练集构建。 5、支撑团队的下游落地项目,将模型能力转化为真实产品体验。
任职要求
任职要求: 1、硕士以上学历,计算机、人工智能、电子信息等相关专业 2、熟练使用 PyTorch,了解 DeepSpeed / FSDP / ZeRO / Megatron-LM 等分布式训练框架。 3、对多模态模型有深入理解:熟悉视觉编码(ViT / Swin)、语言建模(Transformer / LLM)、跨模态对齐与融合机制。 4、具备独立阅读论文、快速复现和实现新模型的能力。 5、有较强的工程能力与调优经验,能解决显存瓶颈、数据效率、收敛稳定性等问题。 6、对大模型训练有强烈兴趣,乐于探索并持续打磨自己的训练 pipeline。
所属行业:
医学检测/体检
职能分类:
算法工程师
工作城市:
杭州,招聘1人,详细地址:临平区东湖街道红丰路609号
职位要求
学历要求:
研究生·985/211
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
50-100万*12薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
技术部门+到面
视频面试:
可以接受