**********************
GPGPU 软件高级架构师
  • 收藏职位
  • 分享职位
60-150万 北京 研究生 5-8年 招聘 1 人 预计佣金 189K 00:32发布
SSS 迅致直营 72小时新发
JD基本信息
岗位职责
一、核心岗位职责 1. 主导 GPGPU 全栈软件架构的顶层设计、技术演进规划与迭 代落地,涵盖编译器、Runtime 运行时、驱动、计算库、工具 链等核心模块架构设计与优化。 2. 负责 GPGPU 软硬件协同架构设计,深度对齐硬件微架构、 计算核心、存储体系、指令集,制定软硬件接口规范与协同 优化方案,最大化硬件算力利用率。 3. 牵头解决 GPGPU 软件栈核心技术瓶颈,包括编译优化、并 行任务调度、内存管理、异构计算协同、性能调优等架构级 难题,保障软件栈 PPA(性能、功耗、面积)与稳定性。 4. 构建 GPGPU 软件性能评估、测试与优化体系,主导面向 AI 大模型、高性能计算(HPC)、云计算、自动驾驶等场景的软 件栈定制化架构设计与性能调优。 5. 跟踪 GPGPU、异构计算、并行编程、编译器等领域前沿技 术,主导核心技术预研、技术选型与专利布局,搭建团队技 术规范与研发流程。 6. 带领软件研发团队完成架构落地、代码评审、技术攻坚, 指导中初级工程师成长,统筹跨硬件、验证、算法团队的协 作与项目交付。 7. 参与 GPGPU 硬件架构前期定义,从软件视角输出硬件设计 建议,保障硬件架构对软件栈的友好性与算力可扩展性。
任职要求
二、硬性专业要求 1. 学历与经验:计算机科学与技术、软件工程、电子工程等 相关专业硕士及以上学历;具备 8 年及以上 GPGPU/GPU/AI 加 速芯片软件全栈研发经验,5 年及以上软件架构设计/技术负 责人经验,有量产级 GPGPU/GPU 软件架构主导设计经验者优 先。 2. 全栈技术精通:深度掌握 GPGPU 软件全栈技术,包括编译 器(LLVM/GCC)、Runtime 运行时、内核态/用户态驱动、并行 计算库(CUDA/ROCm/OpenCL/SYCL)、指令集调度、异构计算 框架等核心模块的架构设计与源码研发。 3. 软硬件协同能力:精通 GPGPU 硬件架构、SIMT 执行模型、 存储层次、总线互联原理,具备成熟的软硬件协同设计、联 合调优实战经验,能基于硬件特性做软件架构深度适配。 4. 核心技术功底:扎实的计算机体系结构、编译原理、并行 算法、操作系统内核、内存管理、多线程调度理论基础;精 通 C/C++/汇编/LLVMIR 等编程语言与中间表示。 5. 工具与框架:熟练使用 LLVM、GCC、GPGPU-Sim、Perf 等编 译、仿真、性能分析工具;熟悉 CUDA/ROCm 生态、AI 框架 (TensorFlow/PyTorch)与 GPGPU 的适配原理。 6. 项目与交付:具备大型软件架构从 0 到 1 落地、团队统筹、 项目风险把控经验,能主导软件栈的版本规划、质量管控与 量产交付。 三、软性能力要求 1. 具备全局化架构设计思维与技术前瞻性,能独立完成复杂 GPGPU 软件全栈的顶层规划与技术决策。 2. 优秀的跨团队沟通、协作与项目推进能力,可高效联动硬 件、验证、产品、算法团队达成研发目标。 3. 极强的技术攻坚与问题定位能力,能快速拆解架构级、底 层级技术难题并输出落地解决方案。 4. 良好的技术文档撰写、方案输出与团队技术赋能能力,具 备严谨的工程化思维与质量意识。 5. 抗压能力突出,能适配芯片研发周期的关键节点攻坚、多 项目并行的工作节奏。 四、优先加分项 1. 有国际头部芯片企业、AI 芯片公司 GPGPU/GPU 软件架构核 心设计与量产经验。 2. 主导过 LLVM、ROCm、OpenCL 等开源 GPGPU 软件生态核心模 块开发与架构优化。 3. 在 PLDI、MICRO、ASPLOS、HPCA 等计算机系统/编译顶会发 表相关论文,或持有 GPGPU 软件相关核心专利。 4. 精通大模型推理/训练加速、超算异构并行、Chiplet 架构 下 GPGPU 软件栈设计与优化。 5. 具备 GPGPU 虚拟化、容器化、云原生适配、安全计算等场 景的软件架构设计经验。 6. 熟悉 RISC-V+GPGPU 融合架构的软件栈设计、定制化编译 器开发与生态适配。 7. 有大规模 GPGPU 软件研发团队搭建、技术体系建设与人才 培养经验。
所属行业:
芯片
职能分类:
芯片架构设计师
工作城市:
北京,招聘1人,详细地址:北京
职位要求
学历要求:
研究生·统招·985/211
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
60-150万*14薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
-
视频面试:
不可以接受
为你推荐