**********************
大模型算法专家
  • 收藏职位
  • 分享职位
70-240万 北京 本科 8-10年 招聘 10 人 预计佣金 312K 1天前刷新/3天前发布
HC多
JD基本信息
岗位职责
1. 从flops efficiency角度,对大模型预训练过程进行分析与探索,包括不限于对scaling law的研究,数据的认知实验,MoE等模型架构设计,以及其他工程与算法结合的ml sys相关优化等。 2. 负责原生多模态大模型的构建与预训练,包括各模态分词器设计,合成数据策略,以及跨模态融合训练策略等,提升原生多模态模型在视觉/语音的理解与生成任务上的能力。 3. 进行大模型reasoning能力的相关研究,研究pre-train / test-time compute对于模型推理能力的影响,借助SFT / DPO / self-play等手段,提高模型在代码数学等推理任务上的表现。 4. 通过post-training激发模型在各下游任务上的能力,从而构建具有通用问题解决能力的agent。
任职要求
岗位基本需求 1. 对大模型有技术热情,熟悉GPT/BERT/T5等模型的原理; 2. 熟悉Python,熟练使用TensorFlow/PyTorch/Megatron/Triton等深度学习训练或推理框架,熟悉java/C++中的一种。
所属行业:
人工智能AI
职能分类:
算法工程师
工作城市:
北京,招聘10人,详细地址:朝阳区小营北路11号鼎成中心D座或者上海东虹桥北新泾的申亚时代广场C座
职位要求
学历要求:
本科
工作年限:
8-10年
技能/证书:
-
薪资福利
年薪范围:
70-240万*12薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受