**********************
AI推理框架工程师
  • 收藏职位
  • 分享职位
60-100万 上海 本科 不限 招聘 1 人 预计佣金 150K 06:13刷新/6天前发布
职位亮点
技术追求度高,薪资包空间大,发展空间大
JD基本信息
岗位职责
职位描述 基于开源引擎,针对音视频等多模态推理场景进行深度适配与优化 针对特定硬件,研究端到端性能极致优化方案 面向实际线上业务场景,研究业界领先的稳定推理部署方案 结合实际综合需求和开源社区相关工作,研究应用通用的推理加速技术
任职要求
职位要求 计算机及相关专业,本科及以上学历 有端到端性能 profile 能力,可以正确理解性能表现的原理,并给出可行的优化分析 有扎实的编程能力和代码品位,良好的数据结构和算法基础 熟悉计算机体系结构和操作系统相关知识,具备软件/库架构的设计与研发经验的更佳 熟练使用 C++/C、Python 等高级语言 有良好的可靠性意识,包括不限于监控、容灾等 有极大技术热情,良好的团队沟通和协作能力,良好的责任心 有良好的自驱力和学习能力 加分项: 在 ACM/NOI/IOI/Topcoder 获奖者优先 掌握任一知名开源推理框架如 vLLM、SGLang、TensorRT-LLM、Llama.cpp 等的开发经验 对常用推理加速算子库(包括但不限于 FlashAttention、FlashInfer、PagedAttention等)有理解 有 CPU、GPU、NPU、ARM 等高性能计算优化经验者优先 有相关音视频信号处理、语音识别、语音合成等经验的优先 对高并发/高可靠性线上服务有经验 熟悉容器化(Docker/K8s)与云上 GPU 运维更佳
所属行业:
人工智能AI
职能分类:
C++
工作城市:
上海,招聘1人,详细地址:上海市徐汇区华发路 699弄2号楼4层
职位要求
学历要求:
本科·统招·一本
工作年限:
不限
技能/证书:
-
薪资福利
年薪范围:
60-100万*15薪
薪资福利:
固定15薪
团队架构
所属部门:
基建部门
下属人数:
-
部门架构:
下属3-4人正式工,还有一些硕博的实习生
汇报对象:
部门leader
职级职称:
面试信息
面试轮次:
2轮
面试流程:
部门leader专业技术面,二面见CEO
视频面试:
可以接受