企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
FAILED
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
大模型GPU推理加速工程师
接单
收藏职位
分享职位
60-300万
北京、上...
本科
3-5年
招聘 24 人
预计佣金
375.4K
03:49发布
72小时新发
HC多
职位信息
职位亮点
大厂
JD基本信息
岗位职责
1.负责大模型推理加速,提升大模型推理速度和并发,降低服务器成本 2. 进行大模型国产服务器适配,包括国产服务器训练和推理优化 3.参与基于GPU的高性能计算(HPC)项目设计与开发,负责GPU芯片(NVIDIA/AMD等)的底层性能优化与调优。 4.熟悉vLLM、SGLang等大模型推理框架。 5.熟悉DeepSeek系列模型的工程优化技术,包括但不限于PD分离、MLA、MOE负载均衡、MTP等
任职要求
1.有不错的编码能力,熟悉 Linux 开发环境,熟悉Python或C++语言。 2.对深度学习技术有较好了解,熟悉常用深度学习框架pytorch,并有实际项目应用经验。 3.熟悉大模型训练和微调算法 4.熟悉cuda编程或者华为昇腾显卡编程, 有相关经验者优先
所属行业:
人工智能AI
职能分类:
编译器开发
工作城市:
北京,招聘8人,详细地址:北京
上海,招聘8人,详细地址:上海
深圳,招聘8人,详细地址:深圳
职位要求
学历要求:
本科·统招·一本
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
60-300万*16薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
4轮
面试流程:
-
视频面试:
可以接受
举报