国双技术全景

TECHNOLOGY PANORAMA

概念解析

根据Gartner最新阐释,智能运维(AIOps)意指整合大数据和机器学习能力,通过松耦合、可扩展方式去提取和分析数据量(volume)、种类(variety)和速度(velocity)这三个维度不断增长的IT数据,进而为IT运维管理产品提供支撑。在传统的自动化运维体系中,重复性运维工作的人力成本和效率问题得到了有效解决,但在复杂场景下的故障处理、变更管理、容量管理、服务资源过程中,仍需要人来掌控决策过程,这阻碍了运维效率的进一步提升。而AI方法的引入,使得机器能够代替人来做出决策,从而让实现完全自动化这一目标在真正意义上成为可能。

 

根因分析(RCA)是AIOps一个重要的领域,涉及到归纳分析和演绎推理的相互结合,是从大数定理到逻辑性完备链条推理的综合应用。从前,根因分析相对简单,因为IT团队需要管理的硬件和软件层较少;如今我们依赖高度动态的多层软件定义环境,映射这些环境中所有组件之间的关系非常困难,尤其是因为配置不断变化,因此很难解释在环境的一层中表现出来的问题与其他层之间的关系。目前,根因分析可以在异常事件发生时,系统收集信息并生成该异常事件的知识图谱,在图的基础上运用演绎推理和归纳推理等方法来对事件根因进行分析。简单理解就是图计算 + 统计 + 规则。根因分析将针对四种指标类型的异常,即时延、交易量、业务成功率、系统成功率,再经过三个步骤的处理和分析,即信息收集、根因定位、根因补充,最终分析出根因。这样一来,比起仅依靠手动分析,AIOps可以帮助IT团队更快地找到性能或可用性问题的根源。


国双优势

国双智能运维的优势在于——应用国双运维知识图谱与图计算能力,将CMDB服务化,深入到DevSecOps的过程中,实现系统自优、自愈。


1)故障自动发现,通过运维知识图谱自动定位故障根因,并自动推荐解决方法;

2)告警信息自动去重降噪,并配合分派策略、排班机制,以多种方式通知告警到相关人员,全面提升告警准确性和管理能力;

3)日志分析系统,支持实现、海量离散日志数据的统一采集和处理,多类型日志解析,支持Lucene语法和SQL语言双检索、提供统一的可视化分析用户界面,可应用于统一日志管理、安全审计与合规、各种业务分析等数字化运维和运营场景、结合统一监控、告警平台、提供业务全链路故障分析。


演进路线

  • 2020年

    AIOps和根因分析应用于国双监控告警系统。




TOP
如您需要我们的帮助,请留言给我们:
*姓名:
*电话:
*公司:
*邮箱:
*内容:
*验证码: