**********************
强化学习研究员/研究工程师(研究院)
  • 收藏职位
  • 分享职位
40-80万 上海 研究生 5-8年 招聘 2 人 预计佣金 48K 07:46发布
72小时新发
JD基本信息
岗位职责
1.研究大模型对齐阶段的广义强化算法,提升大模型的能力,探索创新性算法,解决大模型训练中的复杂问题,如奖励稀疏、策略优化等; 2.针对大模型的挑战,提出有效的训练策略和优化方法,改善模型的训练效率、收敛性以及推理能力; 3.进行强化学习算法的系统评估,分析不同算法在大模型上的表现,识别潜在的瓶颈和改进方向; 4.写作高质量研究论文,在顶级学术会议或期刊上发表研究成果
任职要求
1.计算机科学、人工智能等相关专业硕士及以上学历; 2.熟练使用 TensorFlow/PyTorch 等至少一种深度学习框架; 3.深入理解强化学习理论,包括但不限于 Q-learning、SARSA、深度 Q 网络(DQN)、策略梯度方法等; 4.良好的团队合作精神和沟通能力,有责任心,较强的问题分析和解决能力;5.有可穿戴设备、RLHF 微调相关经验是加分项; 6.有人工智能顶级会议或期刊论文发表经历者优先。
所属行业:
IT服务、系统集成、人工智能AI、云计算、大数据
职能分类:
深度学习
工作城市:
上海,招聘2人,详细地址:11号线龙耀路 国际传媒港央视大楼
职位要求
学历要求:
研究生·统招
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
40-80万*14薪
薪资福利:
七险二金
团队架构
所属部门:
可穿戴设备
下属人数:
不限
部门架构:
-
汇报对象:
经理
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
一面专家,二面业务负责人,三面处长,四面副总经理
视频面试:
可以接受