企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
运维工程师-GPU(外包
接单
收藏职位
分享职位
20-40万
北京
本科
3-5年
招聘 1 人
预计佣金
8.8K
1天前发布
72小时新发
外包
JD基本信息
岗位职责
工作职责: 1. AI平台/数据平台部署与运维 负责AI训练平台和数据平台的部署、升级和维护 管理Kubernetes集群,优化资源调度,确保AI任务稳定运行 负责GPU服务器的运维,包括驱动安装、CUDA环境配置、GPU资源监控与故障排查 2. 云平台配置与管理 负责云平台的配置、运维及优化,熟悉云平台核心架构与运行机制 掌握云平台算力、存储、网络等核心产品的原理,具备丰富的实际操作与运维经验 具备国内主流云厂商(如阿里云、腾讯云、华为云等)及AWS云平台运维经验,能熟练操作对应云产品、排查云环境相关问题 3. 故障排查 快速定位AI训练任务异常(如GPU利用率低、训练任务卡顿等) 处理数据异常、云平台异常及集群相关问题,保障AI平台、数据平台、云平台稳定运行 :
任职要求
岗位要求 1. 必备: 3年+ K8s生产运维经验,熟悉Calico网络 熟悉GPU服务器运维(NVIDIA驱动/CUDA)及Linux/Shell/Ansible 具备国内主流云厂商及AWS运维经验,掌握云算力、存储、网络产品实操 2. 加分项: AI算力平台运维经验 了解RDMA/InfiniBand/RoCE网络 熟悉Python/Go 3. 软技能: 强问题定位能力,主动沟通,抗压好学
所属行业:
人工智能AI
职能分类:
运维开发工程师
工作城市:
北京,招聘1人,详细地址:北京海淀中关村智源大厦
职位要求
学历要求:
本科·统招
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
20-40万*12薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
3轮
面试流程:
-
视频面试:
可以接受
举报
为你推荐
职能类别
IT互联网技术
电子/通信/半导体
销售/客服
制药/医疗器械/医疗护理
高级管理
关于
禾蛙动态
合伙人计划
猎企入驻
帮助中心
禾蛙协议
禾蛙海外版
联系我们
电话:400-777-5125(服务时间:工作日9:00至18:00)
网址:www.hewa.cn
地址:中国(上海)自由贸易试验区滨江大道99弄6号第11层
服务支持
接单方小程序
发单方小程序
微信公众号
©版权所有
上海禾蛙科技有限公司
苏公网安备32059002007268号
备案号:沪ICP备2026021218号-7
|
营业执照
|
服务许可证