产品外传 | 在线吃瓜,原来“智能运维(AIOps)”还可以这样......

2021-03-18

非常简单的一个段子,很直接的展现了运维在产品运营周期中的重要作用,当然,运维能做的还有很多很多,比如……

“洞察历史,预见未来”

是的,今天带给大家的是神州泰岳大IT智能运营产品体系中的一个重要解决方案:神州泰岳智能运维(AIOps)解决方案,将自身的运维工具与人工智能技术相结合,形成智能化运维能力,为上层业务提供AI服务。在企业的生产活动中,有时会出现这样的情景:工程师小张是某公司的技术工程师,某次生产程序出现故障时,小张立刻赶到现场“诊断”问题,但故障比较复杂,小张无法独立解决,急需同事小周、专家老王进行协助,工作量大且效率较低。神州泰岳智能运维(AIOps)解决方案融合了AI算法、大数据、云计算、机器学习、深度学习、自然语言处理、知识图谱、OCR、AR等技术的一系列开放式、实现互联网化、自动化和智能化的高效运维场景并且在使用中具有以下优势:

提升运维效率

将更多日常工作中人工完成的事务交由机器执行并加以分析判断,形成对未知故障的预测能力和异常检测能力。

提升业务保障能力

利用人工智能手段,帮助运维团队及时感知业务系统异常,并提供智能化的处置分析与决策建议,有效保障业务的稳定运行。

优化运营成本

有效地进行智能化的资源优化、容量管理、性能优化,实现 IT 成本的态势感知、支撑成本规划与优化、提升成本管理效率。

典型运维场景

神州泰岳智能运维(AIOps)解决方案通过多个智能运维项目的建设落地积累了丰富的经验,能够协助企业共建未来智慧运维体系:

故障智能处置

构建智能运维平台框架,通过运维流程的可视化编排,调用外部开放能力,实现运维业务“一键应急”自动运维操作。

指标异常检测

指标异常检测主要由三部分组成:在线异常检测、离线分类及模型训练、离线标注及效果评估。

智能机器人客服

秉承灵活、开放、高效的产品设计原则,提供与客户现有平台体系无缝对接的解决方案,打造最会听、最会做、最会学的智能机器人客服。

智能巡检和资产校对

传统巡检及资产校对缺乏系统化、标准化、流程化的管理,故障判断依赖运维人员经验,依赖人工逐一设备查看且运维告警信息很难与实体关联。而智慧运维中的AR运维通过虚实共构,实现数据中心的智能巡检、海量资产自动校对、告警自动关联分析、故障智能排障及远程协助等操作,能够很好地满足未来数据中心和云业务客户在业务响应、业务稳定和售后服务的“快、稳、优”需求。

工单自动分类及热点挖掘

系统通过“智能识别”自动识别并选择工单分类、打标签,减少问题分析定位时间和问题类型定位错位概率,提升服务响应能力,提升支撑人员工作效率。并且可以实时监控热点问题并预警,让支撑人员及时聚焦并处理热点问题,管理层及时聚焦关注热点问题,对历史问题工单进行聚焦、分析,聚类出用户关心的问题,辅助决策。

图像识别

通过OCR技术对图像文件进行智能化分析、识别处理,协助用户完成票据识别、图像相似度比较、图像分类等工作。