企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
专有云智算硬件架构师-北上杭深-P8
接单
收藏职位
分享职位
90-120万
杭州
本科
5-8年
招聘 1 人
预计佣金
193.8K
00:47发布
迅致直营
72小时新发
JD基本信息
岗位职责
岗位描述 1.面向大模型负载的GPU服务器架构定义:基于训练(如3D并行、GRPO强化学习)与推理(如vLLM、TensorRT-LLM)的实际性能瓶颈,主导GPU选型、Scale-Up互连架构(如NVLink/NVSwitch)、CXL互联、内存与存储I/O子系统、电源及散热方案等关键系统组件的技术决策; 2.训推场景驱动的软硬协同优化:结合分布式训练与推理策略、通信库行为(如NCCL)、KV Cache管理、动态批处理等特性,提出硬件感知的系统级优化方案,并推动在固件、驱动或运行时层落地; 3.端到端硬件交付与稳定性保障:参与工程验证、系统级Debug、压力测试及故障根因分析,确保服务器在千卡级大规模集群中长期稳定、高效运行; 4.技术前瞻与生态共建:跟踪AI服务器架构演进趋势,积极参与OCP、UAlink等开放硬件社区,输出面向大模型训推优化的硬件设计最佳实践。
任职要求
岗位要求 1.具备5年以上通用服务器及AI智算服务器硬件系统设计经验,深入理解现代GPU服务器整机架构,具备从系统级视角综合权衡性能、功耗与可靠性的能力,有实际参与AI服务器规格定义、硬件开发或量产交付项目的经验; 2.熟悉大模型训练与推理的核心技术路径,包括但不限于:分布式训练策略(如ZeRO、Pipeline/Model Parallelism)、混合精度训练、主流推理框架(如vLLM、Triton Inference Server)、KV Cache优化,以及GRPO/PPO等强化学习训练范式对计算、通信与存储资源的特殊需求; 3.精通机内通信架构,深度理解基于PCIe、CXL及UALink等技术的Scale-Up互连方案,能够利用内存语义(Load/Store)与低时延特性实现智算超节点内部的算力协同与内存资源池化 4.熟悉国产化智算硬件生态,深入理解主流国产AI芯片(如昇腾、海光等)的架构差异,具备在自主可控要求下进行硬件适配、性能对标及平替方案设计的实战经验 5.了解数据中心基础设施对AI服务器设计的影响,包括液冷/风冷散热适配、高功率供电、机柜部署密度、远程管理(BMC/IPMI)等,能从部署与运维视角反向指导硬件架构设计; 6.具备优秀的跨职能协作能力,能够高效协同芯片厂商、ODM、算法及软件团队,将业务需求转化为可执行的硬件指标,并推动方案端到端落地; 7.具备良好的英文技术沟通能力者优先,可参与国际技术讨论或对接海外合作伙伴。
所属行业:
云计算
职能分类:
技术经理
工作城市:
杭州,招聘1人,详细地址:中国-杭州
职位要求
学历要求:
本科
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
90-120万*13薪
薪资福利:
P8底薪+绩效+奖金+股票
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
一面:部门高级别同事电话沟通---二面:部门leader 线下--三面:线上交叉面--四面:HR
视频面试:
不可以接受
举报
为你推荐
职能类别
IT互联网技术
电子/通信/半导体
销售/客服
制药/医疗器械/医疗护理
高级管理
关于
禾蛙动态
合伙人计划
猎企入驻
帮助中心
禾蛙协议
禾蛙海外版
联系我们
电话:400-777-5125(服务时间:工作日9:00至18:00)
网址:www.hewa.cn
苏州地址:苏州工业园区星湖街328号创意产业园2-B405
北京地址:北京市朝阳区朝阳门南大街10号兆泰国际A座501
服务支持
接单方小程序
发单方小程序
微信公众号
©版权所有
苏州聚聘网络技术有限公司
苏公网安备32059002007268号
备案号:苏ICP备18067483号-3
|
营业执照
|
服务许可证