深圳市大模型评测产品经理招聘-禾蛙,猎头合作交易平台

**********************

大模型评测产品经理

收藏职位

分享职位

80-120万深圳本科 5-8年招聘 1 人预计佣金 128.7K 7天前刷新/两个月前重新发布

JD基本信息

岗位职责

岗位职责 1.自动评估体系建设：设计并搭建大模型自动评估体系，覆盖通用能力及专项能力（如推理、写作、语音、VLM 等）；构建评测指标体系与自动化评测流程，推动评测体系标准化、模块化、可扩展化； 2.Benchmark 研究与落地：跟踪国内外前沿大模型评测方法与 Benchmark，研究其评测维度与自动化机制；复现与改造高质量评测集，结合业务场景定制评测任务，确保评测的真实性与可复现性； 3.模型效果分析与策略优化：定期对不同版本模型进行系统评测与对比，输出详细分析报告，识别模型优势与薄弱点；针对记忆、写作、语音、多模态（VLM）等专项能力，设计细粒度评测指标与分析策略，支撑模型迭代方向； 4.用户数据分析与体验优化：持续监测与分析真实用户交互数据，挖掘模型表现的 badcase 与典型问题；与算法及产品团队协作，将用户侧问题转化为可量化的评测指标与优化方案；建立用户体验反馈与评测体系联动机制，推动模型效果持续提升与体验闭环优化； 5.跨团队协作与产品规划：与算法、工程、产品团队紧密配合，定义评测需求与指标体系，推动自动评测体系在实际业务与模型研发中的落地，形成评测 → 分析 → 优化的完整闭环。

任职要求

岗位要求 1.本科及以上学历，计算机科学、人工智能、数据科学、语言学或相关专业优先； 2.熟悉 Python / LLM API / LangChain 流程，有独立搭建自动评估或数据分析管线经验； 3.有 benchmark 构建或论文发表经验（参与自动评估、评测集复现或指标体系设计）者优先； 4.熟悉 AI 搜索、对话评估、生成质量、语音、VLM 等领域评测或策略者优先； 5.具备用户行为数据分析能力，能基于交互日志识别模型缺陷、抽象问题类型并制定优化方案； 6.能独立产出评测报告与用户体验分析文档，将技术评估结果转化为产品优化策略； 7.具备良好的英文论文阅读能力和跨团队沟通协调能力。加分项 1.参与或主导过自动评测体系 / 评测平台的设计与实现； 2.有用户研究、A/B 测试、模型体验优化项目经验； 3.具备科研背景，发表过 NLP / LLM / Evaluation 相关论文。

所属行业:

人工智能AI

职能分类:

产品经理

工作城市:

深圳，招聘1人，详细地址：深圳/北京都可以

职位要求

学历要求:

本科

工作年限:

5-8年

技能/证书:

薪资福利

年薪范围:

80-120万*16薪

薪资福利:

团队架构

所属部门:

下属人数:

部门架构:

汇报对象:

职级职称:

面试信息

面试轮次:

4轮

面试流程:

3轮业务+一轮hr

视频面试:

可以接受

职能类别

关于

联系我们

电话：400-777-5125（服务时间：工作日9:00至18:00）
网址：www.hewa.cn
苏州地址：苏州工业园区星湖街328号创意产业园2-B405
北京地址：北京市朝阳区朝阳门南大街10号兆泰国际A座501

服务支持: 接单方小程序

发单方小程序

微信公众号