方案介绍

对运营商网络实行“主动发现、智能定位、自动处理、协同调度”的运维服务。面向CT全网设备运行、网络业务性能以及业务质量与用户感知, 7*24小时全网故障的实时主动发现、故障根因智能定位、故障自动处理、故障处理协同运维,贯穿网络故障运维的全流程处理环节,从面向设备的监控,到面向业务的监控,再到面向客户的监控,使得监控运维过程真正做到因客户而动,因业务而动。

客户价值

IT手段结合管理流程,助力运维工作发现网络及业务隐患、问题定位、故障处理、运行分析、协同工作,提升运维管理效能,为网络运维降本增效,实现生产流程的闭环管理,降低运维压力,提升工作效率。

核心功能

查看更多

优势特点

经典案例

问题定位

根据网络结构和业务逻辑,结合RCA规则库根因定位。

故障处理

将各类告警按照业务逻辑规则组合按照诊断方案、自愈方案,实现故障自处理,协助维护人员提升解决问题效率。

故障发现

实时接收网络上的各类告警及问题预测。

业务监控

提供集客业务、家客业务、云网业务、切片业务的监控及业务质量评估。

运行分析

对网络、业务、感知等关键指标进行影响性分析和预测,及时发现隐患。

协同工作

打通运维角色、地域上的瓶颈,提供IVR、公告、短彩信通知等运维协同手段,实现线上的全流程闭环运维。

数据整合能力

具备统一的数据模型,融合不用专业、不同厂家、不同格式数据,实现数据的归一化。

系统架构适配能力

设计上采用微服务架构,实现系统的高可用,弹性伸缩,支持高并发,海量数据的秒级监控,提供对外开放的能力。集成提高业务价值和技术要求的“中台”思想。前后端分离,前端组件化,降低后端并发/负载压力。适合未来技术演进。

智能监控能力

监控智能化借助大数据和AI技术支持故障根因定位、故障预测、网络质量评估、业务质量评估。

业务覆盖能力

从故障发现、实时处理、智能判断、故障自愈,到协同工作,海量数据接入,对运营商全专业网络覆盖,是生产环节中的关键节点,实现运维工作的闭环管理。

经典案例

某省运营商综合监控项目

合作背景

在日常维护工作中各个专业相对隔离、网管众多,对运维的支撑工作没有形成合力,不能满足全业务运营支撑保障。综合监控项目立足于各专业、中心的网管之上对各类数据进行标准化,面向全网进行集中监控。

客户价值

综合监控工作直接面向全网设备的运行状况、网络性能以及业务质量与用户感知,系统7*24小时在线运行,为运维人员提供支撑手段,全面提升集中化管理效率。

  

技术方案

围绕如何进行海量告警数据的实时处理以及查询分析来进行架构设计和实现,设计上应用使用springcloud微服务架构,采用kafka、drools、flink、Redis、ES等关键技术满足分布式、系统云化的要求,保证高可用、高并发,数据快速增长的7*24小时运行。

应用场景

1、监控协同运维场景 系统对重大故障/事件,通过智能识别对重大故障/事件进行发布,将信息自动通知到维护人员,同时,系统进行倒计时,对于超时故障/事件进行自动升级/发布,故障修复后,系统自动发布修复信息,实现全流程的线上自动化发布、记录的闭环管理。 2、跨专业故障定位场景 监控人员监控到大面积基站退服,系统按照业务逻辑自动匹配RCA规则库,调用处理规则进行根故障识别,通过判断定位到影响基站退服的传输故障设备。