**********************
语音大模型算法工程师
  • 收藏职位
  • 分享职位
40-80万 北京 本科 5-8年 招聘 1 人 预计佣金 86.4K 一周前发布
JD基本信息
岗位职责
职责描述: 1、 负责语音生成大模型的研发,包括语音合成、音色克隆、情感语音、可控语音、对话合成等; 2、 负责语音端到端大模型的探索,包括模态对齐、预训练、指令微调、强化学习、模型评测等; 3、 负责语音合成数据的优化,包括数据处理、数据评估、数据合成等。
任职要求
1、 计算机科学或相关领域硕士及以上学历; 2、 熟悉常见的语音合成模型(CosyVoice、IndexTTS、F5-TTS等)、语音大模型(Qwen2.5-Omni、Kimi-Audio等)、生成算法(Diffusion、Flow-Matching等)、业界领先的LLM(GPT、LLaMA、Qwen等)的基本原理和训练方法; 3、 具备较强的编码能力,熟悉linux和Python,熟悉PyTorch/Tensorflow等至少一种主流深度学习框架; 4、 具备优秀的学习能力、良好的问题分析能力和责任心; 5、 在国际顶级会议/期刊上有相关论文发表者优先。
所属行业:
人工智能AI
职能分类:
算法工程师
工作城市:
北京,招聘1人,详细地址:东城区中汇广场A座
职位要求
学历要求:
本科·统招·一本
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
40-80万*14薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
3轮
面试流程:
-
视频面试:
可以接受