a. 负责大模型相关语料和数据的撰写与评估等工作,支持项目经理和产研团队定义数据评测和标注环节的理想态;
b. 承接业务与项目经理要求,有意识地通过平台工具等方式提升数据交付的质量和效率,并沉淀方法文档;
c. 深刻理解数据交付的需求,负责数据质量把控,梳理并分析数据质量的问题,并对市场上同类产品有基本的行业了解;
d. 运用基本的数据分析方法和工具,对训练数据进行统计和分析,提供有效的数据结论、数据支持和优化建议。
任职要求
学历专业
a. 统招大学本科及研究生以上学历,中文、语言学(文科)、计算机语言学、计算机(理科)或相关专业背景;
能力素质
a. 学习能力好、逻辑清晰、做事细心。能迅速学习并适应新的任务规范、流程和工具,跟进行业/团队最新要求和优化方向。【必需】
b. 出色的文字理解能力,能快速把握各类长文本的核心内容和关键细节,精确理解语境和意图。【必需】
c. 对于大模型领域有充分的兴趣,关注大模型相关应用的发展;
d. 具有出色的分析和沟通技巧,能在数据分析和效果评估中提出有价值的改善建议,与同事及相关团队密切配合,有效沟通,并推动实施。
经验技能:
a. 具有一年以上数据标注&质检相关经验优先。对于从训练数据到模型效果评估,再到优化的全流程有深入了解者优先;
b. ⚠️备注:完全是安全审核类、传统nlp或分类达标、拉框打标的不要