运维人员最头疼的是什么?在“华为开发者大会2021”期间,笔者采访了近30位运维人员,有意思的是,得到的答案出奇统一——
按计划准备好软硬件资源,按需求安装配置,让业务快速上线,保障服务器上的进程和和业务正常,处理各种故障、响应各方需求……成为操作员、保姆、救火队员,这似乎正是运维老王们的工作日常。
在技术生态中,一方面是运维人员背负着“天选背锅侠“、不受重视的边缘角色,另一方面却是随着云原生、网络与业务多样性发展带来的IT架构日趋复杂、运维专家匮乏的窘境。
还好,随着AI技术不断升温,AIOps也被推到了前端,智能运维新时代,网络AI开发如何更简单?网络运维更高效?让运维人员从纷繁复杂的事件和变更管理中解放出来?
调查发现,如今网络运维面临着不少的挑战,比如故障诊断依赖经验,其中75%由用户发现,更多还是被动式运维,人工积累的经验难以应对网络复杂化带来的新问题,90%时间在定位故障。此外,运维系统割裂,运营商(60%)OSS各专业系统独立,导致新功能应用上线周期长。
显然,传统人工、工具化运维已经不能满足网络新需求,智能化转型的需求迫在眉睫。
电信行业一直都是网络智能化转型的积极探索者,运维能力的演进成为电信网络能否持续发挥效能的关键影响因子。相关数据显示,63%的电信运营商已经开始投资AI、大数据分析等技术,实现故障“自愈”与进行主动维护。
如今,AIOps已经成为智能化运维转型的核心手段,通过构建电信领域AIOps平台能力,快速实现智能运维升级。
所谓AIOps,起源于“Algorithmic IT Operations”算法IT运维,AIOps(Artificial Intelligence for IT Operations)智能运维,是指将AI应用于运维领域,基于已有的运维数据(日志/监控信息/应用信息等),通过机器学习的方式来进一步解决自动化运维没办法解决的问题。
AIOps可谓是前景可期,有研究表明,网络运维成为电信领域最大的AI应用场景,占电信AI应用市场60%以上。
尽管AI已经经过了50多年的发展,有了不少落地应用。但是实际应用中,开发AI应用仍然面临着开发门槛高、周期长等挑战,2019年,企业AI实际应用率为19%较上年增长仅5%,远低于行业23%的预估增长。
我们知道新技术的落地都需要经历炒作周期,与曾在市场上掀起热议的各类技术术语类似,目前关于AIOps的定义与理解也是莫衷一是。有专家指出,2021年AIOps将带来更多炒作与困扰,IT决策者需要从混乱的市场中找到真正适合自身需求的AIOps产品。
某运营商的核心网络运维面临着核心网重复故障少、定位难、故障分析耗时较长,而且人工设置阈值工作量巨大,且KPI难以全面监控,静态阙值无法适配业务动态变化,经常存在漏报、误报的挑战。采用华为AIOps服务后,可以基于AI/ML生成动态阈值,实现各种日常KPI监控场景;多指标的关联分析,分钟级内给出TopN根因指标;内置10余个电信领域模型参数,支持不同场景和局点泛化 。今年4月13日,该运营商实现了提前5小时识别异常并主动预警,7月10日业务变更0投诉。
华为AIOps服务已经成为很多电信运营商构建AIOps的选择。2019年4月,华为正式发布iMaster NAIE网络AI云服务,AIOps服务正是其中的核心组成。AIOps服务的背后是华为沉淀30余年的专业积累和通信经验,覆盖运维全流程,包括预测、检测、诊断、识别等多环节。
除了电信运营商,华为NAIE AI模型与训练服务部部长杨建认为,在企业服务、数据中心领域、SaaS服务供应商这三个领域的智能运维也大有可为。
一是,支持通用数据源。支持Kafka、数据库、文件系统、Restful 等运维系统的主流数据对接方式,让数据上的来。采用数据治理SDK方式,将异构数据(时序数据、非结构化数据、文本数据等)治理成AIOps 原子能力标准输入数据,有效解决数据适配问题。
二是,有丰富的AIOps 原子能力。运维领域AI模型和算法具有开发门槛高,开发周期长的特点,重复开发公共能力,造成资源浪费。华为通过沉淀核心AI资产,采用自主研发+生态合作相结合的方式,提供数字化基础组件,提高AI应用开发效率,降低AI开发门槛。通过行业知识与AI算法融合,优化和自研AI算法,内置电信领域业务模型参数,支持设计态的泛化,运行态的调优。此外,华为AIOps服务 原子能力模型统一标准,使得原子能力可串接。
三是,场景组合编排与DevOps。通过编排能力,不需要写代码,只需可视化的拖拽式编排,降低AI快速开发应用的门槛。
运维场景AIOps可定制,其中流程串接,业务泛化参数配置,事件通知方式、可视化Dashboard 编排等,快速定制运维应用。AIOps原子能力可扩展,AI平台支持算法模型创新与开发,可以自行扩展AIOps能力。
三大核心价值能力解决了AIOps 构建过程中数据对接、数据适配以及定制、拓展等问题,而丰富的电信领域AIOps 原子能力也与行业深度融合,对症下药,让电信客户用得放心省心。
据悉,华为AIOps服务在行业内已经实现了规模应用,覆盖4个业务领域,110+现网局点,每月API调用达4.1亿次,每天有25万告警等。
为了更好服务客户,AIOps服务采用服务化架构。不过,就像前文所说的,开发各领域AI应用需要具备行业经验和AI算法经验,开发难度大。一方面,华为AIOps沉淀典型场景(如运营商网络、园区网络、DC网络、IT应用等)AI资产,帮助伙伴快速上手,轻松部署运行AI应用。另一方面,华为秉持一贯的开放态度,支持合作伙伴开发行业APP,支持合作伙伴发布AI应用到AI市场,合作共赢,共建网络AI生态。
没有一家厂商能够满足企业所有需求,企业级市场生态是关键,AIOps领域也是如此,在企业级市场深耕30余年的华为更加懂得合作才能共赢。
数字化转型在加速,日益分散、异构且高度动态化的现代IT环境随着云计算、容器与微服务技术的普及给包括电信运营商在内的各企业组织带来更大的运维挑战。AIOps已经成为企业组织智能化运维升级的首选,MarketsandMarkets Research发现,目前全球IT从业者正大量采购AIOps工具。
AIOps服务是华为30年行业积累与前沿AI等新技术融合的结晶,相信在助力电信网络运维智能化转型方面,华为AIOps服务也将大有可为。返回搜狐,查看更多
*请认真填写需求信息,我们会在24小时内与您取得联系。