全链路数据监控

核心提示1.行业背景近年来,面对互联网金融的竞争,为了应对市场变化,传统银行将更多的金融服务类产品投入到市场当中,比如第三方支付、网络信贷等金融消费类业务。这些新的业务在为银行创造更高经济收益与社会效益的同时,也对银行IT系统的持续、高效能服务能力

1.行业背景

近年来,面对互联网金融的竞争,为了应对市场变化,传统银行将更多的金融服务产品投入市场,如第三方支付、网络信贷等金融消费业务。这些新业务不仅为银行创造了更高的经济效益和社会效益,也对银行IT系统持续高效的服务能力提出了更高的要求。因此,金融行业开始尝试自己的数字化转型之路,新技术也在快速发展。

银行业务的快速发展和业务模式从网点向电子渠道的逐步转变,导致金融行业的IT资产、业务系统和辅助系统迅速增加。这使得具有稳态应用和敏感应用的双模IT成为常态,系统的复杂度和维护这些系统带来的运维工作量也随之增加。维护系统的可靠稳定运行仅仅依靠增加人力的方式,其边际效应递减越来越明显。因此,金融机构需要在运维模式上进行根本性变革,以适应数字化转型和金融科技发展的需要。

基于上述运维模式的痛点,自动化、智能化的概念得到了快速推广。运维模式的改变也给运维部门带来了管理、组织、流程、技术、工具等方面的新变化。传统的人工运维模式已经完全不能满足当前管理的需要,金融行业的系统运维迫切需要向自动化、智能化模式转变。

以某银行的链路监控分析为例:近年来,银行运维需要监控和管理的链路呈几何级增长,对外通信、互联网、广域网上千条链路的监控和维护难度较大。具体困难如下:

1.缺乏链接使用数据分析平台,无法直观展现链接细节;

2.数据链路多,无法详细掌握每条链路的带宽使用规律,无法对链路本身的使用情况进行准确的监控和报警。一刀切的固定门限告警,非常容易出现虚警和无效告警,消耗运维人员大量精力;

3.无法生成每个业务的链路带宽消耗的详细数据,无法将链路数据与业务数据关联起来,无法知道每个业务对链路带宽的影响。由于一般的业务数据是在SSL之前加密的,解密后的数据要经过众多的网络设备,通常负载均衡防火墙等SSL设备会进行IP SNAT,所以很难按照IP来串联数据中心的一个会话。这就导致在网络运维的链接分析中,缺少服务URL级别的链接比例分析。一旦出现突发,网络运维人员无法感知服务行为,无法快速决策。

4.一旦链路上出现流量突发或带宽满,需要人工分析,机器无法自动生成智能分析报告;

5.链路带宽容量缺乏长期的同比和环比统计数据,无法为链路容量的增减提供充分的数据支持。

2.解决方法

为了满足客户的需求,智威数据结合产品自身的功能特点,推出了nCompass网络链路智能管理解决方案。该方案分为四个步骤:可视化->报警->分析->统计,可以对数据中心链接进行如下管理:

形象化

NCompass提供专业的链路带宽可视化视图,供运维人员查看。该视图可以根据链接的使用情况自动排名靠前,并显示每个链接在一段时间内的变化。与传统的网络链路监控工具不同,nCompass可以提供详细的链路带宽使用明细,可以基于业务维度和通信对维度显示当前时间段带宽消耗最大的对象。

[上图为demo数据演示]

令人担忧

NCompass提供智能报警服务。与传统的网络链路监控工具不同,nCompass拥有智能分析引擎,每个链路的指标数据都会被建模,形成智能基线。如果出现链路带宽使用突发情况,可以通过链路自身数据的智能基线和变化分析实现快速报警。

[上图为demo数据演示]

[上图为demo数据演示]

分析的

NCompass提供自动分析报告,无需手动分析。异常检测触发智能分析模块,实现带宽异常事件的快速分析。分析主要分为两部分:

异常检测模块:

[上图为demo数据演示]

智能分析模块:

NCompass可以实现对带宽比这个顶级对象的分析。通过独有的智能分析引擎,它可以分析运行在这条链路上的流量,找到对这条链路变化贡献最大的对象,并列出细节;

NCompass连接防火墙、负载均衡、SSL日志,在IP维度实现数据中心数据流的数据拼接,从SSL设备获取的明文流量设备可以直接解码七层数据,获取与其前端链路相关的IP和URL,帮助网络运维人员增强对业务对链路影响的理解。

智能分析报告详解

[上图为demo数据演示]

[上图为demo数据演示]

[上图为demo数据演示]

[上图为demo数据演示]

统计的

NCompass提供链接分析的中长期报告。同时,通过链路分析特有的指标,如流入吞吐量、流出吞吐量、带宽流入利用率、带宽流出利用率,对一个月、半年、一年的链路带宽使用情况进行统计分析,形成同比和环比数据。根据各环节自身情况进行分析,做出统计分析报告,为环节能力决策提供依据。

[上图为demo数据演示]

3.价值汇总

NCompass帮助运维人员在链路管理上开始从人工运维向智能运维过渡,实现可视化->告警->可分析->统计的全方位运维管理策略。通过机器代替人工的探索,为链路管理决策和日常维护提供大量的数据支持,充分释放运维人员的压力,帮助他们提高工作效率。

运维系统作为金融企业数字化转型的重要支撑,可以为企业降低成本、提高效率。后续我们会有更多的场景和大家分享,敬请期待!

 
友情链接
鄂ICP备19019357号-22