**********************
资深运维工程师(Linux / 监控方向)
  • 收藏职位
  • 分享职位
80-90万 上海 本科 5-8年 招聘 1 人 预计佣金 70.5K 04:28发布
72小时新发
JD基本信息
岗位职责
岗位定位 负责公司 Linux 基础设施、服务器运维及监控体系建设,保障业务系统稳定、安全、高效运行;主导监控平台、告警机制、自动化运维及故障治理能力的持续优化。 该岗位需要能够从“日常运维”提升到“稳定性治理”和“平台化建设”层面,既能处理复杂故障,也能推动规范、工具、流程与自动化能力落地。 岗位职责 负责 Linux 服务器、虚拟机及云主机的日常运维、配置管理、容量管理与性能优化。 负责业务系统运行环境的部署、变更、巡检、升级及故障处理,保障系统高可用。 负责监控平台建设与持续优化,包括主机、应用、中间件、数据库、网络及业务指标监控。 负责告警体系设计,包括告警分级、告警收敛、告警降噪、通知策略及升级机制。 主导 Prometheus、Zabbix、Grafana、ELK、OpenSearch、日志平台等监控与日志体系建设。 负责服务器性能分析与问题定位,包括 CPU、内存、磁盘、网络、IO、负载等指标排查。 负责线上复杂故障应急响应、问题复盘及根因分析,推动问题闭环和长期治理。 负责建立并持续完善巡检、备份、变更、发布、应急、故障处理等运维标准。 推动自动化运维能力建设,包括 Shell、Python、Ansible 等工具开发与批量运维。 参与系统架构评审,从运维和稳定性角度提出优化建议,包括高可用、容灾、容量与监控设计。 建立 SLA、SLO、告警 MTTA、故障 MTTR 等稳定性指标,并持续跟踪优化。 与开发、网络、安全、供应商等团队协作,推动跨团队问题解决。
任职要求
基础能力 本科及以上学历,计算机、网络、软件等相关专业。 5 年及以上 Linux 运维经验,具备中大型生产环境运维经验。 熟悉 CentOS、Red Hat、Ubuntu 等 Linux 系统,能够独立完成安装、配置、排障及优化。 熟悉 TCP/IP、DNS、HTTP、HTTPS、Nginx、Keepalived、LVS 等基础网络与高可用技术。 熟悉 VMware、KVM 或云平台运维经验,了解阿里云、腾讯云、AWS、Azure 中至少一种。 Linux 能力要求 精通 Linux 常用命令、系统服务、systemd、用户权限、文件系统、计划任务、日志管理。 能够熟练分析 Linux 性能问题,包括: CPU 飙高、Load 高 内存泄漏、Swap 异常 磁盘 IO 瓶颈 网络延迟、丢包、连接数异常 进程异常、僵尸进程、端口占用 熟悉常用排障工具:top、htop、vmstat、iostat、sar、iotop、netstat、ss、tcpdump、strace、lsof、dmesg 等。 具备 Linux 内核参数调优、系统安全加固、资源隔离及容量规划经验。 监控能力要求 熟悉至少一种主流监控平台:Prometheus、Zabbix、Nagios、Datadog、Open-Falcon 等。 熟悉 Grafana 看板设计,能够围绕系统稳定性设计可视化监控大盘。 熟悉 Prometheus Exporter、Alertmanager、监控规则、指标采集与告警编排。 熟悉日志采集与分析体系,如 ELK、EFK、OpenSearch、Graylog、Loki。 能够独立建设以下监控场景:主机监控、应用监控、接口可用性监控、日志监控、链路监控、业务指标监控、容量与趋势监控 有监控降噪、误报治理、告警闭环、值班体系建设经验。 自动化及脚本能力 熟练使用 Shell、Python 进行运维脚本开发。 熟悉 Ansible、SaltStack、Terraform、Jenkins、GitLab CI/CD 等自动化工具者优先。 有自动巡检、自动发布、自动恢复、自动告警处理等平台化建设经验。 综合素质 具备较强的问题分析能力、故障定位能力及抗压能力。 具备较强的责任心和主动性,能够主动发现问题、推动问题解决。 具备良好的跨团队沟通能力,能够推动开发、网络、安全及供应商协同落地。 对稳定性、规范化、自动化有较强意识,能够持续推动体系建设。 优先条件 满足以下任意一项优先: 有大型互联网、物流、快递、电商或跨国企业运维经验。 有 1000 台以上服务器或多国家、多地域环境运维经验。 有 Kubernetes、Docker、容器监控及云原生运维经验。 有 SRE、稳定性治理、故障复盘、SLA/SLO 建设经验。 有日志平台、APM、链路追踪(SkyWalking、Jaeger、Pinpoint 等)经验。 有值班体系、应急响应体系、监控规范建设经验。 持有 RHCE、RHCSA、CKA、AWS、阿里云等相关认证。
所属行业:
物流
职能分类:
运维工程师
工作城市:
上海,招聘1人,详细地址:上海
职位要求
学历要求:
本科·统招
工作年限:
5-8年
技能/证书:
-
薪资福利
年薪范围:
80-90万*16薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
为你推荐