企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
推理引擎专家(研发方向)
接单
收藏职位
分享职位
80-120万
北京
本科
8-10年
招聘 1 人
预计佣金
144K
07:49发布
72小时新发
JD基本信息
岗位职责
1、负责推理引擎核心模块(推理网关、推理调度器、推理框架、异构算力抽象、弹性扩缩容)的架构设计、编码实现与性能调优。 2、主导 GPU/ASIC(NVIDIA、昇腾、寒武纪、昆仑芯 等)推理加速方案落地,完成Token级调度、算子级优化、前缀解码、量化、投机解码、并行推理等关键算法开发; 3、构建基于 K8s 的异构资源调度系统,支持 NUMA/拓扑感知、GPU Direct RDMA网络、共享显存、MIG切分、时空复用,实现日均 10 万卡弹性并发推理任务稳定运行; 4、设计并实现推理服务可观测体系(指标、日志、追踪),通过类似eBPF + Prometheus + Grafana + Jaeger的架构(不限于)完成秒级故障定位与自愈,保障线上 99.95% SLA; 5、负责推理引擎安全沙箱、模型加密、内存隔离、漏洞扫描、国密算法适配,满足电信级与政务云等保三级/密评要求; 6、持续优化推理成本,完成 Spot 抢占、混合部署、潮汐调度、模型冷热分层,实现同等性能下综合成本降低 ≥ 30%; 7、建设自动化性能 Benchmark 平台,覆盖 LLM、多模态、CV、NLP、Speech 等 50+ 主流模型,输出性能基线、回归测试与硬件选型报告; 8、牵头重大客户现场保障,完成超大规模推理集群(≥1 万卡)压测、调优、故障应急,建设可复用性能调优知识库; 9、负责推理引擎相关专利、软著、标准(ITU/CCSA等)申报; 10、指导开发、测试、SRE 工程师,搭建代码评审、CI/CD、性能调优、故障演练体系
任职要求
1、本科及以上学历,计算机、电子工程、人工智能、通信等相关专业,8 年以上云计算/AI平台研发经验,其中 3 年以上推理加速技术带头人经历; 2、精通 C++/Go/Python,熟悉 CUDA/OpenCL/ACL,具备算子级开发与汇编优化能力; 3、深度掌握 GPU/ASIC 硬件架构(SM、Tensor Core、NPU Core、内存层次、互联拓扑),熟悉 NCCL、NVLink、RDMA、GPUDirect; 4、熟悉云原生技术栈(K8s、Operator、Device Plugin、Scheduler Framework、Service Mesh),有二次开发及性能调优经验; 5、熟悉主流推理框架与加速库(TensorRT、vLLM、SGLang、TGI、ONNX-Runtime、MindIE),掌握连续批处理、前缀解码、投机解码、并行推理等优化手段; 6、具备高并发分布式系统设计与调优能力,熟悉 Zero-Copy、AIO、epoll、DPDK、SPDK、共享内存、无锁队列; 7、熟练使用 nsight、perf、bpf、gdb、valgrind 等性能/调试工具,具备线上故障快速定位与热修复能力; 8、具备优秀的算法与数据结构基础,能针对 LLM 推理场景设计新的调度/缓存/压缩算法; 9、具备较强的学习能力、责任心和抗压能力,具备良好的英语读写与沟通能力。
所属行业:
云计算
职能分类:
技术总监
工作城市:
北京,招聘1人,详细地址:北京市西城区西单北大街133号联通大厦
职位要求
学历要求:
本科·统招·985/211
工作年限:
8-10年
技能/证书:
-
薪资福利
年薪范围:
80-120万*13薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
举报
为你推荐
职能类别
IT互联网技术
电子/通信/半导体
销售/客服
制药/医疗器械/医疗护理
高级管理
关于
禾蛙动态
合伙人计划
猎企入驻
帮助中心
禾蛙协议
禾蛙海外版
联系我们
电话:400-777-5125(服务时间:工作日9:00至18:00)
网址:www.hewa.cn
苏州地址:苏州工业园区星湖街328号创意产业园2-B405
北京地址:北京市朝阳区朝阳门南大街10号兆泰国际A座501
服务支持
接单方小程序
发单方小程序
微信公众号
©版权所有
苏州聚聘网络技术有限公司
苏公网安备32059002007268号
备案号:苏ICP备18067483号-3
|
营业执照
|
服务许可证