**********************
资深运维工程师(GOC)
  • 收藏职位
  • 分享职位
80-90万 上海 本科 5-8年 招聘 1 人 预计佣金 70.5K 两周前发布
反馈快
JD基本信息
岗位职责
一、岗位概述 作为企业IT系统应急保障核心技术专家,负责7×24小时、Oncall团队技术赋能与应急体系优化,持续推动运维工作,支撑业务连续性与系统稳定性目标达成; 二、核心职责。 1、设计并迭代Oncall应急响应流程、故障分级标准与复盘机制,主导监控体系(Prometheus/Grafana等)深度优化,构建覆盖业务全链路的智能告警与预警模型; 2、负责故障案例复盘分享、实战演练组织,提升团队整体故障处置能力与技术水平; 3、推动运维自动化工具(Shell/Python/Ansible)与自愈能力落地,编写核心系统应急处置预案(DRP)并定期演练,沉淀《重大故障处置手册》与技术知识库; 4、与开发、架构、业务、安全团队建立常态化沟通机制,提前识别系统潜在风险(如架构瓶颈、容量不足等),推动风险整改与性能优化,参与核心系统架构评审;
任职要求
三、任职要求 1、本科及以上学历,计算机、软件工程等相关专业,,有互联网、电商、物流等行业背景者优先; 2、精通Linux/Unix系统内核级运维,深入掌握网络协议(TCP/IP/HTTP/HTTPS)、数据库(MySQL/Redis/MongoDB)、中间件(Nginx/Kafka/RabbitMQ)原理与调优,具备分布式系统问题排查能力; 3、熟练掌握容器化(Docker/Kubernetes)、云平台(AWS/Azure/阿里云/腾讯云)运维技术,能独立设计云原生环境下的应急保障方案; 4、具备(如大规模服务雪崩、数据丢失、网络攻击等),能在高压环境下快速决策,主导跨团队协作攻坚; 5、精通监控告警工具(Prometheus/Grafana/Zabbix/ELK),具备日志分析、指标建模能力,能编写自动化脚本(Shell/Python)实现故障自愈或效率提升; 6、具备优秀的技术视野与问题拆解能力,良好的沟通协调与团队管理意识,能接受轮班/夜班及节假日值班,对系统稳定性有极致追求。
所属行业:
物流
职能分类:
运维工程师
工作城市:
上海,招聘1人,详细地址:上海
职位要求
学历要求:
本科·统招
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
80-90万*16薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
为你推荐