神州泰岳全栈智能监控产品Ultra-FullStackMonitoring以配置资源管理为核心,以全面自动化为理念,以AI智能运维为支撑,面向IT、CT、IoT领域提供专业的全栈管控适配能力,从IaaS层、PaaS层、SaaS层实现全方位、全场景、跨专业、跨平台、标准化、自动化、数字化、智能化的监控管理,打造贯穿应用系统全生命周期的运维管理解决方案。
某公有云平台作为业内前十的公有云,共有17个资源池节点,分布在全国若干省份,拥有2万余台物理机、20万余台的虚拟机。 神州泰岳协助客户构建了覆盖全国各资源池节点的统一监控管理系统,以一套集中式系统纳管了各个资源池全量被管设备。
1) 提供了覆盖基础设施硬件至业务应用的全栈监控能力,保证监控覆盖无死角 2) 提供了海量资源监控纳管能力,且随着资源池持续扩展,该系统无需进行系统架构及调整即可在未来纳管百万级别以上的监控对象 3) 在海量监控纳管的背景下,还为所有监控指标提供1分钟频率的监控粒度,保证了故障发生的第一时间即可感知故障 4) 所有监控资源均统一存储在CMDB中,实现了监控资源与云资源的集中分析 5) 借助一系列自动化运维能力,客户显著释放了运维人力,以10人左右的管理团队即可对海量监控资源进行运维管理
某公有云的统一监控平台基于神州泰岳Ultra-FullStackMonitoring产品构建,具备极强的监控纳管能力。自系统上线后持续支撑公有云业务的快速发展,提供了从硬件设施到业务应用的全方位端到端运维管理。该系统采用了两级架构设计,一级节点承载监控管理、资源管理、自动化运维等一系列核心功能。,二级节点为采集层与执行层,避免了各资源池建立烟囱式运维系统。两个一级节点采用异地灾备模式,保证一级节点高可用性。 除了对2万余台物理机、20万左右的虚拟机进行统一监控纳管之外,该系统还提供了故障自动诊断、CMDB资源统一管理、运维可视化分析、面向不同角色的统一运维门户、监控大屏及运维掌上APP等功能,协助用户全面提升运维过程中的标准化、自动化、智能化水平。