**********************
算法工程师【推理平台开发】
  • 收藏职位
  • 分享职位
40-50万 上海 本科 不限 招聘 1 人 预计佣金 55.4K 1天前刷新/5天前发布
JD基本信息
岗位职责
1、代码深度剖析与优化:深度分析 vLLM、SGLang 代码逻辑,研究其模型加载、推理执行、调度等核心功能实现,挖掘性能瓶颈,针对性进行代码优化与重构,提升推理效率与资源利用率。 2、框架扩展与功能开发:基于业务需求对 vLLM、SGLang 框架进行功能扩展,实现定制化推理功能开发,如优化 KV Cache 机制、开发动态批处理策略等,满足不同场景下的推理需求。 3、性能调优与测试:结合 GPU 等硬件特性,对 vLLM、SGLang 代码进行性能调优,通过 CUDA、OpenCL 等技术实现底层加速;设计并执行性能测试,验证优化效果,持续改进推理性能。 4、系统集成与协作:将 vLLM、SGLang 框架集成到整体推理平台,与模型训练、数据处理等模块协同开发,确保系统稳定运行;与团队成员紧密合作,共同解决开发过程中的技术难题。 5、技术跟踪与创新:关注行业前沿技术,研究 vLLM、SGLang 相关的新技术、新方法,探索在项目中的应用,推动推理平台技术创新与升级。
任职要求
1、教育背景与专业:计算机科学与技术、软件工程、人工智能等相关专业本科及以上学历,具备扎实的计算机理论基础。 2、专业技能:精通 Python 编程,熟悉 C/C++ 语言,能够熟练阅读和编写复杂代码。 3、深入理解 vLLM、SGLang 框架,熟悉其代码结构与运行机制,有相关框架使用或二次开发经验者优先。 4、熟悉 GPU 编程,掌握 CUDA、OpenCL 等技术,具备 GPU 性能调优经验。 5、了解深度学习原理,熟悉主流深度学习框架(如 TensorFlow、PyTorch),对大模型推理有一定认知。 6、具备良好的系统设计与架构能力,能够独立完成模块开发与系统集成工作。
所属行业:
IT服务、人工智能AI、云计算
职能分类:
算法工程师
工作城市:
上海,招聘1人,详细地址:杨浦区国正中心
职位要求
学历要求:
本科·统招·985/211
工作年限:
不限
技能/证书:
-
薪资福利
年薪范围:
40-50万*13薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
线上初试+线下复试
视频面试:
可以接受