**********************
算法研究员(强化学习方向)
  • 收藏职位
  • 分享职位
50-100万 广州 本科 5-8年 招聘 2 人 预计佣金 96K 4天前刷新/三周前重新发布
JD基本信息
岗位职责
工作内容: 1、负责深入探索和追踪强化学习领域的前沿算法及技术动态,及时将其应用于公司业务场景,推动业务发展。 2、负责强化学习算法的研究与开发工作,包括但不限于奖励模型的设计与优化、强化学习算法的实现及效果调优等,以提升模型的性能和效率。 3、对现有强化学习模型进行评估和优化,针对实际业务问题提出有效的解决方案,持续提升音乐大模型偏好对齐能力。 4、撰写技术文档,记录算法设计、实现过程及实验结果,为团队成员提供技术支持和知识共享。 岗位要求: 1、计算机科学、数学、人工智能、机器学习等相关专业,本科及以上学历,硕士学历优先。 2、具备扎实的数学基础,熟悉概率论、线性代数、数值优化等数学工具在强化学习中的应用。 3、具备强化学习实践经验,熟悉经典强化学习算法,以及深度强化学习的前沿技术,如DPO、PPO、GRPO等。 4、具备大语言模型奖励模型开发、强化学习调优经验者优先。 5、具备较强的问题分析和解决能力,能够快速定位并解决强化学习模型开发过程中遇到的各种问题。 6、熟练掌握深度学习的理论和方法,精通PyTorch、TensorFlow等主流深度学习框架,能够灵活运用其进行模型搭建和训练。 7、具备良好的数据洞察能力,能够从数据中挖掘有价值的信息,为算法优化提供依据。 8、加分项:有音乐背景、热爱音乐、具备强烈的进取心和求知欲,热衷于追求技术创新,能够不断学习和掌握新的技术和方法。
任职要求
1、计算机科学、数学、人工智能、机器学习等相关专业,本科及以上学历,硕士学历优先。 2、具备扎实的数学基础,熟悉概率论、线性代数、数值优化等数学工具在强化学习中的应用。 3、具备强化学习实践经验,熟悉经典强化学习算法,以及深度强化学习的前沿技术,如DPO、PPO、GRPO等。 4、具备大语言模型奖励模型开发、强化学习调优经验者优先。 5、具备较强的问题分析和解决能力,能够快速定位并解决强化学习模型开发过程中遇到的各种问题。 6、熟练掌握深度学习的理论和方法,精通PyTorch、TensorFlow等主流深度学习框架,能够灵活运用其进行模型搭建和训练。 7、具备良好的数据洞察能力,能够从数据中挖掘有价值的信息,为算法优化提供依据。 8、加分项:有音乐背景、热爱音乐、具备强烈的进取心和求知欲,热衷于追求技术创新,能够不断学习和掌握新的技术和方法。
所属行业:
电子商务
职能分类:
算法研究员
工作城市:
广州,招聘2人,详细地址:天河区黄埔大道西平云路163号广电平云大厦B塔19楼
职位要求
学历要求:
本科·统招·一本
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
50-100万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
-
视频面试:
可以接受