企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
首席 AI Infra 工程师 (算力压榨与推理加速)
接单
收藏职位
分享职位
48-78万
杭州
本科
5-8年
招聘 1 人
预计佣金
99.5K
03:50发布
72小时新发
JD基本信息
岗位职责
负责万亿/千亿参数大模型在自建或企业私有 GPU 集群上的极致推理优化。 深度改造主流推理引擎(如 vLLM, TensorRT-LLM),重写底层算子以解决特定长文本(Long Context)推理的显存墙问题。 探索并落地极致的模型量化(FP8, AWQ 等)与 KV Cache 优化技术,将硬件推理成本压缩到极致。
任职要求
精通 C++ / CUDA,具备扎实的 GPU 硬件架构知识。 对大模型底层运行机制和 Attention 机制有源码级别的理解。 在底层开源社区(如 vLLM, DeepSpeed)有核心代码贡献者优先。
所属行业:
人工智能AI
职能分类:
算法工程师
工作城市:
杭州,招聘1人,详细地址:浙江省杭州市西湖区三墩镇西园八路 9 号 1 号楼 11 楼 1102 室
职位要求
学历要求:
本科
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
48-78万*12薪
薪资福利:
薪资可谈
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
举报
为你推荐
职能类别
IT互联网技术
电子/通信/半导体
销售/客服
制药/医疗器械/医疗护理
高级管理
关于
禾蛙动态
合伙人计划
猎企入驻
帮助中心
禾蛙协议
禾蛙海外版
联系我们
电话:400-777-5125(服务时间:工作日9:00至18:00)
网址:www.hewa.cn
苏州地址:苏州工业园区星湖街328号创意产业园2-B405
北京地址:北京市朝阳区朝阳门南大街10号兆泰国际A座501
服务支持
接单方小程序
发单方小程序
微信公众号
©版权所有
苏州聚聘网络技术有限公司
苏公网安备32059002007268号
备案号:苏ICP备18067483号-3
|
营业执照
|
服务许可证