130 likes | 151 Views
Market Guide for AIOps Platforms. 2018 –11 -12
E N D
Market Guide for AIOps Platforms 2018–11-12 AIOps platforms enhance IT operations through greater insights by combining big data, machine learning and visualization. I&O leaders should initiate AIOps deployment to refine performance analysis today and augment to IT service management and automation over the next two to five years.
KeyFinding 给使用者(基础架构领导)的建议: • 通过采用以历史数据开始的增量方法部署AIOps,并逐步使用流数据 • 通过识别能够摄取和提供对文本和指标数据的访问的AIOps平台,选择能够全面了解IT系统过去和现在状态的平台。 • 通过选择以IT运营为导向的机器学习四个阶段(描述,诊断,预测和根因分析)的增量部署能力,以帮助避免高严重性中断。 • AIOps 开始在企业用来做IT运作,甚至用来做商业侧分析 • AIOps技能和IT运营成熟度是实现价值的原因,其次是数据质量 • AIOps平台的企业目前主要用于(APM)和(NPMD)。 • 各厂商正在制定使用机器学习(AIOps中的主要技术)的战略,3V维度的IT运营数据挑战。同时他们正在构建专门化的跨数据存储和人工智能实践。
AIOps市场定义 • 概括:结合大数据和机器学习功能,通过可扩展的提取和分析IT不断增长的数据量、种类和速度来支持所有主要IT运营功能。该平台支持同时使用多个数据源、数据收集方法以及分析和可视化技术。 • 核心功能: • Ingesting data from multiple sources agnostic to source or vendor Enabling data analytics at two points: • Real-time analysis at the point of ingestion • Historical analysis of stored data • Providing access to the data • Storing the acquired data • Using machine learning • Initiating an action or next step based on the result of analysis
市场变化 • AI在过去二十年中间歇性地影响了ITOM的发展,而AIOps平台只是这种影响的最新例子。IT运营成本高、运营的复杂性在不断增加。3V复杂性上升: • IT基础架构和应用程序产生的数据量快速增长(每年增长2到3倍) • 机器和人类生成的数据类型越来越多(例如,指标,日志,有线数据和文档[知识管理]) • 由于采用了云原生或其他短暂架构,数据生成速度不断提高,IT架构内的变化率也在不断提高 • 短板: • 监控工具面对3V受到了压力 • 监控工具不会跨越多种数据类型 • 通用性: • 非IT团队(例如SecOps)需求 • CI与CD团队
IT新诉求 • IT需要采取行动的速度在提高: • 降低噪音(例如,以误报或冗余事件的形式); • 提供更好的因果关系,这有助于确定事故的可能原因; • 捕获超出静态阈值的异常,以主动检测异常情况; • 推断未来事件以防止潜在的故障; • 启动解决问题的操作(直接或通过集成)。 • AIOps能够提供操作与帮助: • 告警 • 问题分类 • CMDB布局 • 运行自动化 • 应用程序发布编排
市场分析 • 目前创业公司以局部功能为主,解决方案不全面,以子功能项目集成为主,分为2类: • 分析结果 • 基本和高级统计分析- 单变量和多变量分析的组合,包括对跨IT实体捕获的指标使用相关性,聚类,分类和推断,以及从源头上管理数据。 • 自动模式发现和预测- • 异常检测- 使用先前组件发现的模式首先确定什么构成正常的系统行为,然后辨别出与正常系统行为的偏差。 • 根本原因确定 • 规定性建议- 对问题进行分类,将其分类为已知类别。然后,它可以挖掘现有的历史解决方案,分析这些解决方案的适用性 • 拓扑- 为了AIOps检测的模式是相关且可操作的,必须围绕所摄取的数据位置放置上下文。使用图形和瓶颈分析捕获事件发生的位置及其上下游依赖关系可以提供将补救工作重点放在何处的深刻见解。 数据摄取和处理 历史和流数据管理- 允许对日志数据,有线数据,指标和文档数据进行摄入,索引和持久存储的软件或设备(参见注释2)。 大部分是非结构化的或多结构化的,并且所存储的数据集本身大量累积,高速变化并且根据高度多样化的格式而隐含地结构化。 它必须提供连贯的跨多个实时数据流和历史数据流分析
数据类型与来源 • 日志数据提取- 允许从任何软件或硬件设备生成的日志文件中捕获字母数字文本字符串的软件,以及为存储编制索引的访问和分析数据的准备。 • 流数据数据接收- 允许直接从网络上的分路器捕获分组数据的软件。所有协议和流信息都应准备用于访问和分析,并为存储建立索引。 • 指标数据提取- 允许直接捕获数值数据的软件(例如,可以立即应用时间序列和更一般的数学运算的数据的捕获)。 • 文档文本摄取- 允许对人类可读文档进行摄取、解析、语法和语义索引的软件。这可能包括使用通常被描述为自然语言处理(NLP)的技术。
选择建议 • 通过采用增量方法确保成功部署AIOps功能 • 选择能够支持广泛的历史和流数据类型的AIOps平台 • 选择能够在IT运营分析和机器学习的四个阶段系统地进步的工具
AIOps是辅助能力 • 过去12个月内有400多个查询涉及IT监控和AIOps的各个方面,包括: • 平台选择 • 部署策略 • ITAIOps用例有助于可视化,决策和诊断 • 与AIOps相关的6%的相互作用是针对ITSM的各种使用案例 • 3%的AIOps交互与DevOps用例有关 • 15%的交互与AIOps可能用于跨各种角色定制仪表板有关
一些观点+讨论 • AIOps不光适用于IT管理,还可以用来分析商业用户行为、安全行为 • 专注做SecOps、DevOps通用能力 • AIOps能够帮助我们积累历史数据(GroundTruth),历史数据和实时数据结合非常重要 • KnowledgeBase 能力需要建设,要起一条线开始调研 • 考虑如何将能力与现有IT体系进行结合(采集、编排、Automation) • 调研+学习国外创新公司的技术