企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
大模型推理优化研发专家(专有云AI域)-P7
接单
收藏职位
分享职位
70-90万
杭州
研究生
5-8年
招聘 1 人
预计佣金
145.4K
00:24发布
迅致直营
72小时新发
JD基本信息
岗位职责
岗位描述 ● 参与大模型推理引擎(基于 SGLang 框架)的设计与核心模块开发,支持 Transformer、MoE、DiffusionLLM 等多种架构及 LLM/VLM 等模型的高性能推理。 ● 运用低比特量化、投机采样、稀疏计算、分布式推理等技术,加速大模型推理速度并降低部署成本, 并优化其稳定性、易用性。 ● 针对 GPU/AI 芯片架构(含自研硬件),开展针对性性能调优,优化算子、内存管理、KV Cache 管理等核心模块 ● 与算法、产品及业务团队协作,推动不同模型场景下的系统端到端性能优化 ● 关注并引入前沿大模型推理技术,参与 SGLang 及相关开源生态的维护与贡献
任职要求
岗位要求 ● 计算机、人工智能等相关专业本科及以上学历,具备扎实的计算机体系结构与并行计算基础 ● 精通 C/C++、Python 编程,熟练使用常用性能分析和调试工具 ● 熟悉并有实际使用经验的主流推理框架,如 SGLang、vLLM、TensorRT-LLM 等 ● 掌握 GPU/AI 芯片编程及常用加速库(cuBLAS、cuDNN、Cutlass 等),熟悉模型并行、流水线并行、NVLINK/GPU 通信等高性能计算技术 ● 有大模型推理、算子优化、模型压缩/量化、分布式部署与调度经验者优先 ● 参与或贡献过 SGLang、vLLM 等推理框架的开源项目者优先 -北深杭
所属行业:
云计算
职能分类:
技术经理
工作城市:
杭州,招聘1人,详细地址:中国-杭州
职位要求
学历要求:
研究生
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
70-90万*13薪
薪资福利:
P7底薪+绩效+奖金+股票
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
一面:部门高级别同事电话沟通---二面:部门leader 线下--三面:线上交叉面--四面:HR
视频面试:
不可以接受
举报
为你推荐
职能类别
IT互联网技术
电子/通信/半导体
销售/客服
制药/医疗器械/医疗护理
高级管理
关于
禾蛙动态
合伙人计划
猎企入驻
帮助中心
禾蛙协议
禾蛙海外版
联系我们
电话:400-777-5125(服务时间:工作日9:00至18:00)
网址:www.hewa.cn
苏州地址:苏州工业园区星湖街328号创意产业园2-B405
北京地址:北京市朝阳区朝阳门南大街10号兆泰国际A座501
服务支持
接单方小程序
发单方小程序
微信公众号
©版权所有
苏州聚聘网络技术有限公司
苏公网安备32059002007268号
备案号:苏ICP备18067483号-3
|
营业执照
|
服务许可证