**********************
阿里云智能-智算全栈系统优化专家-杭州
  • 收藏职位
  • 分享职位
70-90万 杭州 本科 5-8年 招聘 1 人 预计佣金 135K 02:46刷新/1天前发布
迅致直营 反馈快 72小时新发
JD基本信息
岗位职责
岗位描述 该岗位将承担智算底层系统性能优化、全栈协同性能优化两个方向的职责。 1、主导AI领域下阿里云云原生多租底层系统的性能瓶颈分析及优化设计,提升底层系统弹性、性能及成本竞争力。 2、优化AI应用场景安全容器运行时、虚拟化、linux内核等核心组件性能。 3、设计高并发、低延迟的云原生底层系统架构,支持AI场景节点pod极速弹缩及系统稳定性。 4、在云原生底层(操作系统内核、容器运行时、CRI-O等)和AI工作负载间建立性能优化协同框架,支撑大模型训练、分布式推理等AI应用在安全容器运行环境中保持性能竞争力。 5、优化AI模型在安全容器环境下的部署、分发、加载效率,支持AI应用极速启动。 6、设计并开发定制化监控和诊断工具链,实时分析云原生AI场景的GPU、CPU、内存、网络、存储性能瓶颈及热路径。
任职要求
岗位要求 1、5年以上系统性能相关经验,有AI领域性能调优经验者优先。 2、深入掌握Kubernetes、containerd、CRI-O等容器生态技术,了解安全容器的技术思路及相关实现;熟悉Linux内核(如Cgroups、Namespace、eBPF)及系统级资源隔离技术;熟练使用性能分析工具(如perf、bcc、Prometheus、Jaeger、火焰图)定位云原生系统的性能瓶颈。 3、精通PyTorch/TensorFlow等框架,熟悉分布式训练优化(如数据并行、模型并行);具备GPU加速经验(CUDA编程、cuDNN、NCCL库调优)或TPU环境优化经验;熟悉模型压缩技术(如知识蒸馏、混合精度训练、TensorRT优化)。 4、熟练使用Rust/C/Python等语言,具备从操作系统底层到用户态服务的全栈优化能力。 5、工作中具备责任心,对于新技术有好奇心,具备较强的跨团队合作及沟通能力。
所属行业:
云计算
职能分类:
安全专家
工作城市:
杭州,招聘1人,详细地址:中国-杭州
职位要求
学历要求:
本科·统招·985/211
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
70-90万*13薪
薪资福利:
P7
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受