**********************
阿里云智能-异构计算软硬件结合开发专家-AI领域北京杭州p7
  • 收藏职位
  • 分享职位
70-90万 北京 本科 5-8年 招聘 1 人 预计佣金 135K 05:35刷新/一周前发布
迅致直营
JD基本信息
岗位职责
岗位描述 1. 针对整机柜超节点服务器,全面赋能计算、互联、监控、故障及性能诊断等核心能力; 2. 梳理适配超节点异构服务器产品的业务场景,开展对应的昆仑组件设计与开发,涵盖性能评测分析、容器镜像等关键模块; 3. 基于整机柜硬件架构及典型业务落地场景,构建典型故障与异常案例库,并设计相应的故障诊断方案; 4. 负责跟踪与研究主流GPU架构设计技术,参与下一代AI Infra的规划与设计; 5. 结合业务画像,构建面向异构硬件与系统的全链路量化分析模型,形成数据驱动的决策数据库,有效推动异构服务器产品的规划与规模化落地。
任职要求
岗位要求 1. 具备5年以上异构计算软硬件结合开发经验,熟悉GPU/AI ASIC部件的硬件设计、芯片架构以及对应的服务器系统设计;熟悉至少一种主流GPU架构(NVIDIA GPU、AMD GPU等)者优先; 2. 具有 GPGPU 微架构分析的实践经验,具有 AI 芯片设计及相关软硬件技术研究成果者优先; 3. 熟悉 GPU 满载运行过程中常见的 RAS(可靠性、可用性、可维护性)质量稳定性问题,以及软硬件协同性能profiling等相关技术问题,并具备实际解决问题的能力; 4. 熟悉python、C++及Linux开发环境 ,熟练掌握CUDA编程技术;具备Cutlass、Triton等开发调优经验者优先;掌握常用profiling工具的使用和分析能力; 5. 熟练掌握基础AI框架(如PyTorch、TensorFlow),大模型训练框架(如Megatron、DeepSpeed)和大模型推理框架(如SGLang、vLLM); 6. 深入理解常见大模型结构及算法原理,掌握训练推理的主流工程优化技术; 7. 具备较强的学习能力和抗压能力,能够适应快速发展的行业环境; 8. 具备较强的跨团队协作能力和沟通能力。
所属行业:
企业级软件
职能分类:
技术经理
工作城市:
北京,招聘1人,详细地址:阿里巴巴北京总部园区
职位要求
学历要求:
本科·统招
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
70-90万*13薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受