**********************
数据标注W4-韩
  • 收藏职位
  • 分享职位
5万 西安 大专及以上 0-3年 招聘 8 人 预计佣金 2.3K 06:26发布
SSS 72小时新发 HC多 外包
JD基本信息
岗位职责
"1. AI 模型评测数据标注 对比多个大模型(如 Qwen、DeepSeek、GPT-4o 等)在高德真实用户 Query 上的输出结果; 根据预定义的意图分类体系、任务完成度、事实准确性、用户体验等维度,进行人工打分或排序; 标注模型输出中的错误类型(如幻觉、意图错判、信息缺失、格式错误等); 参与 MAD-style 高分歧样本挖掘,帮助识别模型能力边界。 2. 大模型训练样本标注(SFT / RAG) 对用户原始 Query 进行结构化改写与增强(如补全模糊需求、标准化表达); 基于商品库、POI 信息、交通规则等知识,生成高质量、可执行的结构化输出(如 JSON 格式的票品选择、路线规划); 对大模型生成的候选答案进行Best-of-N 精筛,选出最符合用户意图和业务规则的版本; 参与多轮对话状态标注,识别用户当前任务阶段(如确认、追问、切换意图等)。"
任职要求
"1. AI 模型评测数据标注 对比多个大模型(如 Qwen、DeepSeek、GPT-4o 等)在高德真实用户 Query 上的输出结果; 根据预定义的意图分类体系、任务完成度、事实准确性、用户体验等维度,进行人工打分或排序; 标注模型输出中的错误类型(如幻觉、意图错判、信息缺失、格式错误等); 参与 MAD-style 高分歧样本挖掘,帮助识别模型能力边界。 2. 大模型训练样本标注(SFT / RAG) 对用户原始 Query 进行结构化改写与增强(如补全模糊需求、标准化表达); 基于商品库、POI 信息、交通规则等知识,生成高质量、可执行的结构化输出(如 JSON 格式的票品选择、路线规划); 对大模型生成的候选答案进行Best-of-N 精筛,选出最符合用户意图和业务规则的版本; 参与多轮对话状态标注,识别用户当前任务阶段(如确认、追问、切换意图等)。"
所属行业:
移动互联网
职能分类:
数据标注
工作城市:
西安,招聘8人,详细地址:西安阿里中心
职位要求
学历要求:
大专及以上
工作年限:
0-3年
技能/证书:
-
薪资福利
年薪范围:
5万*12薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
为你推荐