**********************
阿里云智能-存储可观测系统技术专家-AI领域-杭州/上海-7
  • 收藏职位
  • 分享职位
40-80万 杭州 本科 8-10年 招聘 1 人 预计佣金 104K 4天前刷新/7天前发布
迅致直营 反馈快
JD基本信息
岗位职责
1. 负责文件存储可观测性指标体系设计实现,定义监控指标埋点和采集流程标准、定义产品全链路关键性能指标、实现数据和元数据全链路请求追踪方案、构建多层级监控体系,支持实时监控与历史趋势分析。 2. 负责文件存储异常诊断系统,基于可观测性指标体系开发故障根因分析和定位能力,基于 AI Agent 构建故障分析和故障处理方案智能推荐。 3. 与客户支持团队对接,提供可观测工具,辅助 SRE 团队快速响应客户问题。
任职要求
1. 熟悉软件开发和系统架构,熟练掌握至少一门编程语言,C++、java、python、go。 2. 五年以上云计算、存储可观测系统相关的工作经验。熟悉云存储文件存储(NAS)、对象存储(OSS)等产品的核心架构,了解分布式存储系统的设计比如容灾机制、性能调优方法,能根据存储产品特性设计针对性可观测指标。 3. 有大规模分布式系统监控架构设计经验,包括日志,监控,链路追踪等,熟悉 Prometheus、Grafana、ELK、Jaeger、Zipkin 等工具,具备处理大规模数据经验者优先。具备智能运维 AIOps 和 MLOps 比如通过大模型和 AI Agent 辅助可观测系统设计相关经验者优先。 4. 工作态度严谨,具备良好的学习能力、沟通能力,团队协作和分析解决问题的能力,以及“客户第一”的服务意识。
所属行业:
云计算
职能分类:
运维经理/主管
工作城市:
杭州,招聘1人,详细地址:杭州或上海
职位要求
学历要求:
本科·统招
工作年限:
8-10年
技能/证书:
-
薪资福利
年薪范围:
40-80万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受