**********************
阿里云智能-高级运维工程师/运维专家-阿里云百炼-7
  • 收藏职位
  • 分享职位
40-80万 北京 本科 8-10年 招聘 1 人 预计佣金 104K 一周前发布
迅致直营 反馈快
JD基本信息
岗位职责
1、稳定性保障与体系建设:负责大模型服务平台及人工智能产品的稳定性保障工作,通过指标建设、预案设计、容量规划、监控完善、建立SOP等手段提升业务可用性与可靠性。 2、高并发流量治理:主导大规模分布式系统及高并发场景下的流量治理方案设计与实施,包括弹性扩缩容以及熔断、限流、降级等容灾策略,确保业务连续性与鲁棒性。 3、新环境部署:在新环境上进行一整套推理系统及其上下游依赖的部署和运维,负责日常模型的上架、性能监测、中间件和底层基建性能监测等。 4、Oncall与应急响应:参与OnCall值班,快速定位并解决生产环境故障,主导重大事件应急响应与复盘;建立故障快速恢复机制,推动根因分析及长效改进措施落地。 5、运维自动化:优化现有部署、监控及维护流程,推动运维自动化与平台化建设,提升研发效率与系统可观测性。负责监控/日志/网络/存储等原生基础设施的保障和工具开发。
任职要求
1、计算机及相关专业,5年以上的SRE/Devops经验,有大型互联网公司运维经验者优先。 2、熟悉常见的公共云服务,熟练使用通用云产品(如VPC、ECS、SLB、RDS等),具备云原生运维经验。 3、深入理解Linux系统原理及运维体系,熟悉分布式系统设计。熟练掌握Kubernetes与Docker架构及技术原理,有大规模生产集群的部署、调优及故障排查经验。 4、熟悉Prometheus、Grafana、ELK、SkyWalking、OpenTelemetry等可观测性技术栈。 5、至少掌握Python/Go/Shell任意一门语言,熟悉主流Web框架,有运维工具开发经验者优先。 6、具备优秀的逻辑分析能力与系统性思维,对技术敏感度高,有强烈的责任心,具备优秀的沟通能力、执行力及团队合作精神。
所属行业:
云计算
职能分类:
运维经理/主管
工作城市:
北京,招聘1人,详细地址:北京
职位要求
学历要求:
本科·统招
工作年限:
8-10年
技能/证书:
-
薪资福利
年薪范围:
40-80万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受