**********************
大模型训练架构师
  • 收藏职位
  • 分享职位
50-135万 北京 本科 不限 招聘 3 人 预计佣金 158K 3天前刷新/5天前发布
迅致直营
JD基本信息
岗位职责
1. 负责大模型训练架构层面训练与加速支持,包括使用DeepSpeed、Megatron-ML实现TP、PP等并行框架 2. 负责结构化数据大模型核心算法的前沿技术探索与落地,包括超大规模预训练、指令微调、强化学习等,从多语言角度出发,解决幻觉、长文本等问题; 3. 负责模型加速与优化,轻量化设计与处理,包括模型剪枝/量化等算法研发。
任职要求
1. 学历要求:本科及以上学历,计算机相关专业; 2. 工作经验:无要求; 3. 专业能力: - 有大模型实操研究经历、预训练或指令微调经验,熟悉QWen、LLaMA、Deepseek等大模型的训练和部署; - 对DeepSpeed、Megatron-ML等框架非常熟悉; - 有TP、PP并行实操经理,熟知底层原理与实现方式; - 扎实的计算机和深度学习基础,能够灵活应用解决实际问题; - 熟悉大模型、深度学习原理和基本模型,熟练使用常用深度学习工具; - 较强的算法实现能力,掌握Python/C++/C等语言。 4. 个人素质: - 具有较强的学习能力和创新精神; - 具备良好的团队合作精神和抗压能力; - 具备较强的责任心。
所属行业:
人工智能AI、大数据
职能分类:
大数据架构师
工作城市:
北京,招聘3人,详细地址:北京
职位要求
学历要求:
本科·统招
工作年限:
不限
技能/证书:
-
薪资福利
年薪范围:
50-135万*15薪
薪资福利:
五险一金
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
3轮
面试流程:
-
视频面试:
可以接受