**********************
百炼推理优化技术专家/高级开发工程师-北京/杭州
  • 收藏职位
  • 分享职位
40-70万 杭州 研究生 3-5年 招聘 3 人 预计佣金 113.1K 06:15发布
迅致直营 72小时新发
JD基本信息
岗位职责
岗位描述 1. 多模态模型的推理功能开发和性能优化,包括对Qwen-VL、Qwen-Audio、Qwen-Omni等多模态输入/输出模型的功能支持和推理性能优化。 2. 分布式推理架构的研发,包括多机推理架构设计,P/D分离、A/F分离、VL模型分离架构的落地。 3. 推理引擎服务化,包括推理引擎如何接入线上服务平台,自动扩缩容和可观测性的适配,以及提升线上服务稳定性。
任职要求
岗位要求 1. 计算机/人工智能相关专业硕士及以上学历,熟练掌握C++和Python编程语言,和软件工程面向对象设计(OOP,OOD)等相关技术, 有很好的抽象能力。 2. 掌握性能优化方法论,能够快速定位系统瓶颈的原因,能够利用Roofline Model来计算IO、计算和带宽的理论极限,并用编程技术逼近极限。 3. 良好的技术洞察力、拥有技术激情、快速学习和协同落地能力,自我驱动力强,具有创新精神。 加分项 1. 熟悉开源LLM推理引擎的架构和实现, 对推理引擎领域开源项目有持续关注。 2. 有分布式推理系统架构设计和性能优化经验。 3. 有CUDA编程基础和算子性能优化经验。 4. 有过高性能计算领域文章发表等相关经验。
所属行业:
云计算
职能分类:
技术经理
工作城市:
杭州,招聘3人,详细地址:中国-杭州
职位要求
学历要求:
研究生
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
40-70万*13薪
薪资福利:
P6底薪+绩效+奖金+股票
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
一面:部门高级别同事电话沟通---二面:部门leader 线下--三面:线上交叉面--四面:HR
视频面试:
不可以接受
为你推荐