JD基本信息
岗位职责
岗位职责:
1. 参与点富产品涉及领域模型能力建设及优化工作,不限于(m) llm、模型sft、rlhf、多模态理解等,使模型效果位于业界领先水平
2. 负责 (m) llm、agents 和 rag 技术的研究与应用,构建自动化前后端工程生成与维护能力,进行技术验证和持续优化
3. 调研大模型前沿技术方案,在模型训练范式、模型结构、数据配比探索最佳实践方案,取得业务效果大幅提升的同时实现前沿技术突破.
任职要求
任职要求:
1. 计算机科学或相关领域学位,拥有丰富的深度学习理论和实践经验,以及至少1年以上的大模型算法开发经验
2. 熟悉深度学习的并行处理和分布式训练技术,具备在多节点多gpu环境下进行大模型训练的经验或能力
3. 熟练掌握transformer架构,moe,机器学习,深度学习,强化学习等核心原理以及pytorch,tensorflow框架的应用以及原理
4. 熟练大模型微调技术,掌握unsloth,swift,llamafactory等一种或多种微调框架或 熟练掌握百度千帆,阿里百练等在线微调平台一种或多种
5. 熟练掌握模型推理优化,熟练掌握vllm,llama.cpp,triton,xinference等.
工作城市:
北京,招聘1人,详细地址:北京市辉煌时代大厦3层wework