**********************
AI大模型算法工程师(偏大数据)
  • 收藏职位
  • 分享职位
30-150万 北京 研究生 3-5年 招聘 1 人 预计佣金 158.4K 07:03发布
72小时新发
JD基本信息
岗位职责
1.主导 TB 级多语⾔语料、图⽂对、视频等全模态数据的获取、清洗与质量评估,构建可持续迭代的⼤ 模型“数据引擎”; 2.设计数据配⽐、去重、毒性过滤、隐私脱敏、知识增强等算法策略,持续提升预训练与后训练数据的 知识密度与安全性,搭建数据⾃动化处理流程; 3.建设⾃动化数据标注与主动学习平台,结合弱监督、远程监督与 Reward Model,实现⾼质量指令微 调数据(SFT/RLHF)的低成本、⼤规模⽣产; 4.跟踪 ACL、EMNLP、WWW、KDD 等顶会数据⽅向最新进展,将前沿数据选择、数据合成、课程学 习等⽅法转化为专利、论⽂与业务落地。
任职要求
1.计算机、⼈⼯智能、信息管理、计算语⾔学等相关领域的硕⼠/博⼠; 2.熟悉多模态⼤模型数据清洗全流程,掌握分布式数据处理流程与质量评估算法; 3.具备⼤模型数据⼯程实战经验:主导过 1T tokens 以上语料清洗,熟悉 Hugging Face datasets、 Data-Juicer等⼯具; 4.编程扎实,精通Python/SQL等语⾔,对数据安全与合规有系统认知; 5.在ACL/EMNLP/WWW/KDD 等顶会或期刊以⼀作/共⼀发表过数据挖掘、数据质量、弱监督学习相关 论⽂,或拥有核⼼专利
所属行业:
企业级软件
职能分类:
算法工程师
工作城市:
北京,招聘1人,详细地址:北京石景山
职位要求
学历要求:
研究生·统招·985/211
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
30-150万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
-
视频面试:
可以接受
为你推荐