**********************
大模型微调技术专家
  • 收藏职位
  • 分享职位
30-50万 广州 本科 3-5年 招聘 1 人 预计佣金 45K 两周前发布
反馈快
JD基本信息
岗位职责
1.负责大语言模型、多模态模型的微调方案设计,包含指令微调、偏好对齐(RLHF/DPO)、领域适配等技术落地。 2.基于业务场景指导构建高质量微调数据集,完成数据清洗、筛选、蒸馏与增强。 使用 LoRA、QLoRA、全参数微调等技术在主流框架(Transformers、DeepSpeed、Axolotl 等)上完成训练、消融实验与效果迭代。 3.对微调模型进行自动化评测与人工评估,一致性、安全性等问题,持续优化效果与推理性能。 4.与工程、产品、业务团队协作,将微调模型部署上线,支持推理加速、量化、蒸馏等工程化落地。 5.跟踪前沿微调技术与论文,沉淀内部工具链、最佳实践与技术文档。
任职要求
1.计算机、人工智能、数学等相关专业本科及以上学历,2年及以上大模型微调 / 训练相关实战经验。 熟练使用 PyTorch,精通 DeepSpeed、Swift 、LLaMA-Factory等训练框架,能独立完成微调全流程。 2.熟悉主流大模型架构与微调范式,理解指令微调、RLHF/DPO、SFT 等原理。 3.具备高质量数据集构建经验,熟悉数据清洗、去重、过滤、增强与评估方法。 4.有 GPU 集群训练经验,了解分布式训练、混合精度、显存优化、模型量化等工程技巧。 5.具备良好的模型评测与问题分析能力,能通过实验定位并改善模型效果。 6.具备较强的论文阅读与复现能力,对新技术有快速落地能力。 7.加分项:有垂直领域模型落地经验、开源项目贡献、顶会论文、多模态微调经验。
所属行业:
产业互联网
职能分类:
技术经理
工作城市:
广州,招聘1人,详细地址:广州市海珠区螺旋大道广州国际生物岛合景科胜广场B塔
职位要求
学历要求:
本科
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
30-50万*16薪
薪资福利:
央企福利待遇
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
-
视频面试:
不可以接受
为你推荐