**********************
大模型训练和优化
  • 收藏职位
  • 分享职位
18万 北京 本科 0-3年 招聘 1 人 预计佣金 4.5K 08:38发布
SSS 72小时新发 外包
JD基本信息
岗位职责
1.负责大语言模型,多模态大模型等的训练和推理工作。 2.大模型指令微调数据的生成,设计与优化,确保输入到模型中的数据质量 3.使用分布式框架(如PyTorch、TensorFlow、DeepSpeed、Colossal-AI等)高效地 训练大规模模型,解决训练过程中的性能瓶颈问题。 4.技术创新与研究:跟踪机器学习领域的最新研究成果,探索并应用新技术、新算 法以提升模型性能。 5.对接业务需求,组织开发资源,进行AI项目管理
任职要求
基本要求: 1.学士学位或以上学历,计算机科学或相关专业,有大型互联网公司或者AI实验室 工作经验者优先 2.至少2~3年的Python软件开发经验 3.精通Python软件架构和开发最佳实践 4.坚实的计算机基础,包括数据结构和算法 5.具备优秀的分析和解决问题的能力,能够独立进行复杂问题定位与解决; 6.有大模型分布式训练理论和实践经验,熟悉国内外主流基础大模型优先 7.熟悉常见的分布式计算框架(如MPI、DeepSpeed、Colossal-AI、OneFlow),有大 规模并行计算和分布式训练系统开发经验优先 8.具备良好的算法基础,对深度学习模型训练优化有深入理解和实践经验,包括但不 限于梯度压缩、通信优化、异步训练等优先
所属行业:
人工智能AI
职能分类:
深度学习
工作城市:
北京,招聘1人,详细地址:海淀区西北旺联想总部
职位要求
学历要求:
本科·统招
工作年限:
0-3年
技能/证书:
英语四级
薪资福利
年薪范围:
18万*12薪
薪资福利:
六险一金(按照当地最低基数和比例),班车,节假日福利
团队架构
所属部门:
联想研究院
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
视频+现场
视频面试:
可以接受