**********************
高级算子开发工程师/专家(上海或北京)
  • 收藏职位
  • 分享职位
70-100万 上海 本科 0-3年 招聘 2 人 预计佣金 112K 6天前刷新/7天前发布
JD基本信息
岗位职责
【职位描述】 深入跟踪研究主流或新兴 LLM、VLM 推理过程中的算子及相关优化技术。 为推理引擎提供算子层面的优化、支持与适配,在实际生产环境中落地应用。
任职要求
【职位要求】 计算机或相关专业本科及以上学历,具备扎实的计算机基础。 熟练掌握 C/C++ 编程语言,具备良好的系统软件开发和架构设计能力。 熟练运用 CUDA/Triton/RoCM 等编程原语开发 AI 领域的各类算子,对 Volta/Ampere/Hopper 等至少一代的架构实现有深入的算子移植,开发和优化的经验。 熟悉并行计算技术,包括但不限于内存访问模式优化、资源利用率优化、计算通信重叠等。熟悉关键性能指标的含义及影响因素,掌握性能分析工具的使用,如 Nsight Compute。 【加分项】 熟悉 NVIDIA 最新 Blackwell 架构的关键特性及其针对性优化策略者优先。 熟悉 Triton/TileLang/CuTe DSL者优先。 有语言/多模态,文生图/视频/3D等生成式大模型研发、性能调优或部署经验,了解 vLLM/SGLang 或FlashInfer/TensorRT-LLM 等大模型高性能推理框架引擎的实现优化原理与具体流程方案者优先。 对 GEMM/Attention 等 AI 重要的算子,具备深度高性能优化经验者优先。
所属行业:
云计算
职能分类:
C++
工作城市:
上海,招聘2人,详细地址:浦软大厦
职位要求
学历要求:
本科·一本
工作年限:
0-3年
技能/证书:
-
薪资福利
年薪范围:
70-100万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
3轮
面试流程:
-
视频面试:
可以接受