**********************
goc运维工程师
  • 收藏职位
  • 分享职位
40-70万 北京 本科 3-5年 招聘 1 人 预计佣金 73.4K 一周前发布
反馈快
JD基本信息
岗位职责
岗位职责: 1、负责GOC的日常运营管理,保障核心业务系统、网络架构及基础设施的稳定运行,实时监控系统状态与业务指标。2、建立并优化GOC监控体系,包括制定监控指标、配置告警规则,快速响应各类告警信息,精准定位问题根源并协调相关团队推进解决。 3、参与重大故障的应急处置,牵头组织跨部门协同(如研发、运维、业务等),制定故障处理预案并落地执行,事后完成故障复盘与总结优化。 4、负责GOC相关运营流程的梳理、制定与迭代,提升运营效率与规范化水平,输出日常运营报告、故障分析报告等。 5、对接业务部门需求,结合GOC运营数据,提出系统优化、流程改进的合理化建议,支撑业务持续稳定发展 6、建立和完善监控管理、故障应急响应、复盘改进的全生命周期管理体系;设计和推行运维规范、应急预案、知识库,提升团队整体应急效率。 7. 负责7×24小时系统全局监控值守,处理平台告警、异常事件快速研判、分级上报与闭环处置,保障业务全年高可用稳定运行。 8. 承接线上突发故障、熔断、抖动、雪崩等应急响应,协同研发、网络、云、数据库、机房等团队排障止损。 9. 负责重大活动、大促、高峰期业务保障,提前巡检风险、制定应急预案、值守盯防、容灾切换演练。 10. 梳理线上故障台账,开展故障复盘、根因分析,输出优化方案,推动监控盲区、薄弱链路整改。 11. 优化告警规则、大屏可视化运维,优化告警降噪、收敛、分级策略,降低无效告警。
任职要求
1、计算机相关专业本科及以上学历;3年及以上GOC相关工作经验,或具备运维监控、系统运营、应急处置或互联网/软件行业运维/SRE/技术支持经验相关岗位经验 2、具备丰富的大型系统线上故障处理和分析经验,有担任过故障指挥官者优先。 3、熟悉GOC运营模式,掌握主流监控工具(如Zabbix、Prometheus、N9e、Grafana、Nagios等)的使用与配置,具备监控体系搭建能力。 4、了解容器(Docker/K8s)、中间件(Nginx/Redis/Kafka/MQ)等关键技术,掌握Shell/Python/Go等至少一种脚本语言,能编写自动化脚本处理日常问题。 5. 抗压能力强,节假日轮值、夜间应急值班,故障处置条理清晰。 6. 沟通协调能力优秀,跨部门推进问题效率高,责任心强,做事严谨不遗漏告警。 7. 会Shell/Python基础脚本优先,有金融、政企、互联网大厂GOC/SRE值守经验优先。
所属行业:
人工智能AI
职能分类:
运维工程师
工作城市:
北京,招聘1人,详细地址:北京市西城区金融科技中心
职位要求
学历要求:
本科
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
40-70万*14薪
薪资福利:
六险二金
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
3轮
面试流程:
-
视频面试:
不可以接受
为你推荐