English

产品介绍

自动化操作中心是一款可提供场景化IT运维服务的自动化运维能力中台。产品具备自主管理运维指令能力,可视化灵活编排运维流程能力,支撑巡检类、操作类等各种运维场景,致力于实现更安全、更高效的IT运维管理,为实现AIOps转型奠定坚实基础。

优势分析

产品功能

适用场景

经典案例

“双模”式布局

实现开发者/使用者双模式区分,开发者模式更专注于自动化能力开发;使用者模式更倾向于对于自动化运维能力的运用。针对不同用户整合产品核心功能,方便用户使用,提升产品体验感。

可视化编排设计

将复杂的操作过程,采用拖拽流程图的方式来编辑和控制任务执行的顺序及逻辑,降低使用门槛,提升运维工作的易用性。

平台化操作能力

统一的运维操作入口,支持界面化运维,通过kafka消息通信保障系统的实时性,使初级的运维人员也能使用平台实现高效的运维。

复杂环境兼容设计

针对复杂环境,提供兼容 Shell、Python、DB等多种脚本类型,跨服务器执行,实现复杂网络环境下主机、网络、数据库、中间件、应用系统等各种资源的自动化运维。

开箱即用能力

基于神州泰岳将监控运维领域二十余年所积累的经验总结为以下交付物,面向客户提供开箱即用式的运维场景支撑能力。

安全设计保障

基于SSH安全规范化,支持4A认证,提供安全加固自动化修复场景。

开放性设计

提供开放的接口,供其他外部系统调用,与其他生产流程实现贯通,发现并定位故障后,自动调用接口,实现故障自愈。

作业管理

来自不同场景下的自动化运维作业可统一调度执行,支持手动、自动、定时、事件触发等多种执行方式,统一集中监控执行状态、查看结果、数据分析。

资源纳管

支持操作系统、数据库、网络设备等资源的纳管,并且支持同CMDB体系深度融合,实现资源数据融合,全面解决数据一致性问题。

指令仓库

系统提供统一的指令编辑及脚本管理,支持按资源分类管理原子指令、指令集,适配多场景,支持脚本文件导入同时支持Shell、python语言在线编辑、校验、测试。

能力仓库

可视化的编排快速完成业务流程,将复杂的操作过程,采用拖拽流程图的方式来编辑和控制任务执行的顺序及逻辑,降低使用门槛,提升运维工作的易用性。具备低代码开发能力,针对于大部分设备报文不需开发解析脚本,只需界面配置,即可实现设备报文解析及输出。

能力超市

平台内置自动化能力超市,超市上架1000+自动化运维能力,同时支持将本地固话场景上传同步至能力超市以便丰富完善相关自动化能力。内置12种大类,50种子类的能力,覆盖大部分常用自动化巡检、故障处理等应用场景。

工作台

自动化运维能力中台主要分为两种使用模式,开发者模式和使用者模式。开发者模式下,用户菜单和功能更倾向于能力开发、能力流程编排等自动化任务开发任务;使用者模式下,用户更注重自动化巡检作业编排,执行历史、执行报告的查看,告警等内容处理。

共享运维知识经验

将运维专家的经验知识固化到系统内共享给其他人使用,降低运维人员技能要求。

自动备份/稽核

获取设备实时数据进行配置备份、配置规范性稽核、空闲地址稽核等操作,规范数据标准。

故障自愈

根据规则自动处理常见故障,无需人为干预即可快速恢复服务。

配置文件集中管理

对分散的配置文件进行集中、可视化管理,实现配置文件的采集、比对和批量分发。

应用系统巡检和拨测

检查应用关键指标,进行作业巡检,探测应用参数和性能。

设备日常巡检

替代人工自动巡检设备运行情况,自动生成报告。

配置信息批量修改

批量修改设备参数,大幅提高工作效率。

应用系统安装部署升级

以串行或并行编排流程顺序,快速实现软件批量安装部署、升级。

经典案例

运营商监控运维平台

合作背景

为某运营商业务提供定时巡检/作业计划、告警预处理、一键启停、自动备份等核心功能。同时平台故障处理职场降至秒级,部分故障可实现故障自愈。

客户价值

1、集团接口_业务平台告警自动处理。

2、平台实现紧急情况一键处理。

3、部分故障可实现故障自愈。

  

技术方案

替代人工自动定时巡检(远程)机房或设备指标状态、作业计划检查项,以往巡检30台主机需人工花费60分钟,利用自动化巡检,5分钟即可完成对外提供能力,告警产生时触发调用预处理规则,达到预处理或故障自愈的目的紧急时一键切换应急方案,保障业务运行不受影响或阻止影响范围扩大快速对网络数据的配置数据、主机的应用等进行集中备份存储。

应用场景

设备指标状态自动巡检、配置备份、一键应急。