企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
强化算法研究员
接单
收藏职位
分享职位
80-120万
深圳
研究生
5-8年
招聘 1 人
预计佣金
137.3K
5天前刷新/两个月前发布
JD基本信息
岗位职责
工作职责 1.作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题; 2.主要关注比SFT泛化效果更好的强化学习;能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标; 3.能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent; 4.作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案。最好是探索一套通用可扩展的 Agentic Workflow 解决方案。
任职要求
任职资格 1.自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士以上学历; 2.有5年以上的工程编码经验,熟练掌握 Python,C/C++,Golang,Java,JavaScript,TypeScript 等至少一种语言; 3.掌握深度学习基础知识,能根据具体问题做针对性优化,熟悉深度学习中不同任务及相应的主流模型和算法; 4.对 Prompt Engineering、Agentic Workflow、GRPO等新的基于GPT结构的NLP强化学习方法 有实践经验; 5.有高质量论文发表者优先(如ACL、EMNLP、NeurIPS、ICML、ICLR等)。
所属行业:
云计算
职能分类:
算法工程师
工作城市:
深圳,招聘1人,详细地址:滨海大厦
职位要求
学历要求:
研究生
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
80-120万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
3轮业务+一轮hr
视频面试:
可以接受
举报