**********************
AI芯片软件专家
  • 收藏职位
  • 分享职位
50-100万 成都 研究生 8-10年 招聘 1 人 预计佣金 140K 07:05刷新/03:17发布
72小时新发
JD基本信息
岗位职责
核心系统软件开发 主导 AI 芯片运行时(Runtime)、驱动(Driver)及基础库(Lib)的设计与优化,构建高效的异构计算框架。 开发多卡集群通信协议(如 RoCE/InfiniBand),实现分布式训练 / 推理任务的负载均衡与性能调优。 工具链与开发环境构建 设计 AI 编译器工具链(如 TVM/MLIR 适配),优化算子融合、内存分配及指令调度,提升模型推理效率。 开发调试工具(Debugger)、性能分析工具(Profiler)及自动化测试框架,支撑芯片量产交付。 系统协同与生态适配 协同算法团队完成模型量化、稀疏化及硬件友好型优化,实现算法与芯片架构的深度协同。 支持主流深度学习框架(TensorFlow/PyTorch)的适配与性能调优,推动 AI 应用在自研芯片上的落地。 前沿技术探索 跟踪存算一体、Chiplet 等架构趋势,探索新型计算模型(如大语言模型推理加速)的软件实现路径。 优化低功耗设计(DVFS/UPS)及安全机制(RAS),保障芯片在复杂场景下的稳定性与可靠性。
任职要求
硕士及以上学历,计算机、电子信息、集成电路等相关专业,8 年以上系统软件开发经验,3 年以上团队管理经验。 专业能力 精通 C/C++ 编程,熟悉 Linux 内核(内存管理、设备驱动)及 Makefile/bash 脚本开发。 掌握异构计算模型(CUDA/OpenMP),具备高性能计算库(如 cuDNN/MKL-DNN)优化经验。 熟悉 AI 芯片架构(NPU/GPGPU),有 2 次以上芯片软件量产交付经验,成功支持流片后调试。 技术深度 至少精通以下一项:AI 编译器开发(LLVM/TVM)、分布式通信协议(RDMA/CXL)、大模型推理加速。 熟悉 AI 框架底层实现,具备算子级性能调优(如矩阵乘、卷积)或模型量化经验。 综合素质 具备复杂问题拆解能力,能独立制定技术方案并推动跨团队协作。 对技术趋势敏感,持续关注 AI 芯片软件栈(如编译器、运行时)的演进方向。
所属行业:
芯片、集成电路
职能分类:
嵌入式软件开发
工作城市:
成都,招聘1人,详细地址:成都市高新区天府大道1199号银泰中心2号写字楼/优先成都
职位要求
学历要求:
研究生·统招
工作年限:
8-10年
技能/证书:
-
薪资福利
年薪范围:
50-100万*12薪
薪资福利:
谈年包,可突破,具体看人选情况
团队架构
所属部门:
研发部
下属人数:
不限
部门架构:
目前属于研发部门下AI芯片子架构,预计规模20-30人
汇报对象:
部门长
职级职称:
-
面试信息
面试轮次:
3轮
面试流程:
HRD-部门长/老板-老板 终面需到面,报销差旅费
视频面试:
可以接受