JD基本信息
岗位职责
岗位职责:
1、全栈性能评测体系设计与分析
(1)应用系统层评测:负责通用推理与大模型推理的评测框架设计、开发与优化,制定性能、精度及系统级评估标准.
(2)微观内核层评测:主导面向算子的微观性能与功能评测体系设计.
(3)训练性能评测:负责构建及优化训练场景的性能与效率评测方案.
2、瓶颈诊断与优化牵头
(1)基于全面的测试结果,进行深度分析,精准定位瓶颈所在层级(框架、算子或硬件).
(2)牵头框架优化:针对框架级别的性能瓶颈,主导设计并推动优化项目的实施.
(3)牵头算子优化:针对关键算子的性能瓶颈,主导或深度参与其重写、融合及底层优化工作,并推动其在框架中的集成与部署.
3、自动化测试与效能平台建设
(1)推动构建集成ci的自动化测试与性能分析流水线,支持多硬件、多框架的自动化比对与回归测试.
(2)建立性能数据追踪、分析与可视化体系,为优化决策与效果验证提供持续数据支持.
4、技术协同与方案落地
(1)与硬件厂商、开发团队及业务方紧密协作,将测试结论与优化方案转化为可执行的技术任务.
(2)负责推动优化方案落地,验证优化效果,并沉淀为标准实践、工具或代码贡献.
任职要求
任职要求:
1、学历与经验
(1)硕士及以上学历,计算机、人工智能、软件工程等相关专业,8年以上工作经验.
(2)5年及以上ai系统开发、性能优化或深度基准测试经验.
(3)有mlperf等基准测试工具深度使用经验,或具备自研测试平台/工具链实践经验者优先.
2、核心技术能力
(1)编程与开发基础:精通python/c++,具备优秀的代码能力和系统调试能力.
(2)框架开发与优化经验:熟悉pytorch/tensorflow等至少一种主流ai框架的架构与内部机制,有框架层性能调优或模块开发经验者优先.
(3)算子开发与优化经验:具备ai算子开发、内核优化经验,熟悉cuda等编程模型,有算子级性能调优项目经验者优先.
(4)性能分析与诊断能力:深入理解计算机体系结构,具备全栈性能瓶颈的定位与分析能力.
3、工程与实践能力
(1)具备出色的项目推动力、跨团队协作能力和技术文档撰写能力.
(2)逻辑严谨,自驱力强,能够主动跟进ai领域的前沿技术.
(3)有开源ai项目贡献或相关领域公开技术输出者优先.
工作城市:
上海,招聘1人,详细地址:上海中兴通讯大厦