产品特性智能运维 | 品牌云呐 |
软件名称云呐智能运维AIOps | 版本语言简体中文版 |
系统平台要求Linux | 硬件要求适配市面大部分系统 |
软件类型安全相关软件 | 版权浙江云呐柏川智能系统有限公司 |
配套附件系统硬件 | 技术支持线上线下培训 |
版本类型企业版 |
云呐IT智能运维管理系统-一体化网络安全监控运维管理
数据接入层
数据接入层即云呐统一运维管理平台,为智能运维的核心层。
对下负责将环控系统、BSM监控系统 、安全感知平台、安全管理平台及其他业务系统的告警数据整合,此外还提供更强大的 REST API 以及方便的 Email、短信集成方式,可将任何系统的告警数据快速接入到TOC智慧平台。
对上负责将分散的数据归集,是分散数据的处理枢纽。另外可以通过北向接口把数据集中的提供给大数据平台。
数据融合层
数据接入层仅仅完成对数据的集中,集中数据仅仅完成智能的基础,数据的价值在于能为未来决策提供准确的依据。借助大数据引擎,把运维场景中状态数据、性能数据、告警数据、业务数据放入引擎进行分析,通过分析结果建立基于业务场景的运维模型,通过不同业务模型的建立,完成从业务到基础数据的无缝衔接;
智慧应用层
智慧应用层为智能运维的成果体现,数据融合层提供基于大数据的分析结果。可根据不同的数据模型,模块化的添加不同的应用,实现基于大数据的应用管理。
另外,还提供对基于该应用层的数据展现,可以基于应用层的分析结果做2D大屏展现、3D立体展现等,也可以通过终端进行访问。
智能运维分步建设
面对工具多样性、告警源多样性、数据多样性、团队多样性的场景,TOC 方案提供了边融合、边迭代的解决方案。
通过 “松耦合” 的方式持续整合***运维工具、数据、流程,持续优化运维数据共享、团队协同、资源优化的运维效果,***终实现智能大数据运维
***步:实现集中的告警服务台
分析梳理已有运维工具的告警数据源,选择适当的接口方式(API,邮件解析、短信解析、插件等)实现告警数据在TOC 的统一集中管理。同时严格规范告警策略和告警规则。
这个过程中可以依据实际情况逐步对工具进行合理的替代、升级、补充。设立集中的告警服务台岗位(团队),对TOC告警规范规则、及时响应负责任。
***步:对接工单(ITSM)服务流程管理
TOC 作为汇聚多个告警源的集中告警服务台,与ITSM 工单流程统一对接,不仅避免各局部告警工具分别与ITSM 流程对接,而且能够从更高维度实现服务流程的统筹规划,从更高维度实现不同告警源的关联告警合并开单,提升服务管理能力和效率。
第三步:实现全局的统计分析
有了前两步的集中服务管理数据,可以通过全局的数据统计评价各告警源的规范性、各类服务响应的SLA水平,发现运维服务瓶颈,优化服务资源匹配。
第四步:梳理全局业务关联和告警关联
随着TOC 逐步整合汇聚的数据源不断丰富,可以在TOC 平台实现对全局业务关联逻辑,告警关联逻辑梳理,提供更***的业务运维视图,并能基于海量数据确定故障影响的范围。
实现这一效果的前提是TOC数据的完整性达到足够的程度。
第五步:大数据平台数据融合
随着TOC运维数据的沉淀,依靠人工梳理,数据之间的关联关系远远不够,需引入大数据平台。根据TOC数据沉淀及现有的数据集和问题点,结合有监督学习和无监督学习的方式,进行机器学习,通过反复训练的方式,进一步提高场景和算法的拟合度,逐渐完善基于现有场景的智能算法。
第六步:大数据应用的建设
大数据平台实现数据融合后,建立基于大数据场景的模块化应用。以智能算法及大数据作为支撑,依据算法输出的预测结果,简化IT运维操作,为运维管理决策提供更大的价值。
云呐统一运维管理平台,通过对网络设备管理、服务器管理、存储设备管理、业务应用管理、无线管理、日志分析、IP摄像头、办公设备/联网设备、动环系统等本地和异地网络的实时监控、自动巡检,***采集、分析故障信息,判断重要数据性能指标,实现大规模数据中心的集中统一管理。