企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
异构GPU集群资源优化技术专家-杭州
接单
收藏职位
分享职位
70-90万
杭州
本科
5-8年
招聘 1 人
预计佣金
135K
1天前发布
迅致直营
72小时新发
JD基本信息
岗位职责
岗位描述 1. 负责智算集群中GPU资源的全面监控、质量巡检及故障预测,通过智能化运维手段确保系统的高可用性和稳定性,提前识别并解决潜在问题。 2. 保障在线POD的集群资源管理与切分业务,优化资源分配策略,提高资源利用率和任务处理效率,支持大规模分布式计算的需求。 3. 开发和维护KuberGPU技术,实现GPU资源的高效切分与容器化部署,支持多款智算相关产品的多种应用场景,提供灵活且强大的GPU资源共享解决方案。 4. 开发和实施容器热迁移技术,提升集群灵活性和容错能力,确保在不停机的情况下进行系统维护和资源调度,进一步增强用户体验和服务连续性。
任职要求
岗位要求 1、精通C/C++/Go等核心开发语言,具备Python、Rust、Shell等一种或多种语言的开发经验,拥有规范的工程化编码能力。 2、深入理解Linux系统,具有Kubernetes及容器化技术的实战经验,有大规模生产系统软件的开发与运维经验。 3、熟悉异构计算编程,具备AI相关背景;有CUDA、分布式计算或高性能计算相关项目经验者优先。 4、具备GPU虚拟化、资源隔离、热迁移、集群资源调度管理、大规模监控、巡检及稳定性建设等相关经验者优先。 5、计算机相关专业,5年及以上相关领域经验,具备优秀的学习能力,有责任心,具备团队协作精神。
所属行业:
云计算
职能分类:
技术经理
工作城市:
杭州,招聘1人,详细地址:中国-杭州
职位要求
学历要求:
本科
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
70-90万*13薪
薪资福利:
P7
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
举报