**********************
大模型算法工程师(海外、国内)
  • 收藏职位
  • 分享职位
50-100万 成都 本科 8-10年 招聘 1 人 预计佣金 126K 1天前刷新/2天前发布
迅致直营 72小时新发
JD基本信息
岗位职责
1.负责大模型技术研究; 2.负责大模型全流程训练与开发,能主导10B及以上参数规模大模型的端到端训练; 3.完成大模型领域适配; 4.负责设计并落地适用于大模型训练的PB级文本数据处理流水线,面向任务及装备体系的运用、组成、活动、消息交互关系等体系架构设计; 5.完成大模型领域适配; 6.完成训练故障诊断与稳定性保障。
任职要求
二、任职要求 1.数学/信号/计算机/物理等专业硕士及以上学历,3年以上工作经验,博士学历优先; 2.模型训练经验:独立完成至少10B参数规模的大模型全流程训练; 3.分布式训练实践经验:精通 DeepSpeed 或 Megatron-LM的底层原理与调优,熟练使用数据和模型并行混合训练策略设计; 4.数据工程与质量控制:设计过PB级文本数据流水线,包括基于LLM的自动化数据清洗(如过滤低质量/重复内容)、分词器定制(SentencePiece/BPE)、分词效率优化、数据分布偏差检测与修复(如长尾分布校准); 5.具备大模型和多机多卡训练故障诊断能力; 6.熟练使用国产智能算力,如昇腾、寒武纪等; 7.优先条件:①复现过FlashAttention-2、MoE架构或长上下文优化(如4K128K),并优化通信开销/显存占用;②有推理端到端优化经验(如KVCache压缩,INT8量化)或云平台调度经验;③具备医疗/金融/法律等垂直领域大模型训练经验,能处理行业特有数据噪声与合规需求。
所属行业:
消费金融
职能分类:
试剂/IVD研发
工作城市:
成都,招聘1人,详细地址:中电科10所
职位要求
学历要求:
本科
工作年限:
8-10年
技能/证书:
-
薪资福利
年薪范围:
50-100万*12薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
为你推荐