**********************
高性能网络高级架构师-杭州/北京
  • 收藏职位
  • 分享职位
70-120万 杭州 本科 8-10年 招聘 1 人 预计佣金 113.4K 一周前发布
反馈快
JD基本信息
岗位职责
负责高性能网络系统的架构设计与技术演进,围绕 RDMA网络、超节点 等核心技术,构建低延迟、高吞吐的网络基础设施,支撑 Agent时代的AI 推理和训练、分布式存储、KV cache等业务场景。作为网络架构师,推动技术选型、方案落地与团队能力建设。 核心职责 • 主导高性能网络架构的规划与设计,涵盖数据中心网络拓扑、RDMA 网络方案、集合通信优化等方向; • 负责ScaleOut和ScaleUP网络的选型、部署、调优及故障排查,保障大规模集群的网络性能与稳定性; • 深入理解商用网的特性和自研网卡的开发,推动硬件能力与业务场景的深度结合; • 设计并优化 AI 训练场景下的集合通信方案,包括 NCCL 调优、网络拓扑感知调度、流量工程等; • 推动网络可观测性体系建设,建立网络性能基线、异常检测和根因分析能力; • 跟踪业界前沿技术发展,输出技术洞察与演进路线; • 与上层业务团队紧密协作,端到端解决跨领域性能瓶颈
任职要求
计算机科学、网络工程、通信工程或相关专业; • 8 年以上高性能网络( AI 基础设施)架构设计经验; • 精通 RDMA 技术栈(InfiniBand / RoCE),熟悉 libibverbs 编程模型、MR 管理、QP 状态机等核心概念; • 深入了解主流 RDMA 网卡(NVIDIA ConnectX-5/6/7)的特性与调优方法,有实际部署和性能优化经验; • 熟悉数据中心网络架构(Spine-Leaf / Fat-Tree / Dragonfly 等),具备大规模(千卡以上)集群网络设计经验; • 熟悉 Linux 网络协议栈、内核旁路技术(DPDK / SPDK)及网络性能分析工具(perftest、ib_write_bw 等); • 有强烈技术热情和好奇心,自驱力和学习力强;具备良好的分析与解决问题的能力、沟通以及团队合作能力;喜欢挑战性的技术研发工作,善于攻坚克难,有创新热情,积极乐观,坚韧抗压,结果导向,能够持续推动问题的解决和突破; • 掌握AI基础知识,掌握基础提示词工程,会使用Al专业工具,集成AI到个人工作流;有AI相关开发工具应用研发经验者优先,持有阿里云ACA/ACP/ACE认证证书者优先
所属行业:
云计算
职能分类:
技术总监
工作城市:
杭州,招聘1人,详细地址:浙江省 杭州市 云谷园区
职位要求
学历要求:
本科·统招·985/211
工作年限:
8-10年
技能/证书:
-
薪资福利
年薪范围:
70-120万*16薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
为你推荐