本文来自中国计算机协会云应用分会。
老阳在2022年会上的演讲回顾随着金融科技的创新发展,证券行业生态竞争加剧。据了解,28家上市券商的科技投入规模正以15%以上的增速增长。仅2020年,总投资就将达到239亿。数字化转型成为券商未来发展的战略新高地。
杨认为,证券行业的转型可以分为四个方面:业务在线化、数据业务化、业务智能化和业务创新化。这四个部分大多依赖于基础设施的调整,比如分布式架构的调整,容器化的改造,多批次敏捷应用的发布。这些变化,无论是应用端还是基础设施端,都给运维带来了巨大的挑战。
再加上监管政策的加强,证监会发布的《证券公司分类监管规定》中提到,一个大的业务事件可能会影响公司的分类水平,甚至影响现有业务和新业务的发展。这是证券公司的一项关键任务。在此背景下,进一步推进证券行业数字化业务,需要数字化运维转型提供相应保障。
解决方案:统一、可观察的智能运维
杨认为,目前运维转型的最终目标是实现统一的、可观察的智能运维。这种运维不仅仅是简单的可视化,更是一种完整统一的数据管理能力,可以提供标准化、高质量的运维数据。在算法赋能和分析技术的加持下,场景体现运维价值,反哺业务运营。这是实现终极目标的第一要素,也是最关键的基础。
有了坚实的数据基础,我们就可以搭建一个统一的监控平台,把自主开发的、第三方的、部分开源的监控手段统一在一个监控系统和监控视角下,然后把相关的告警集中输出,统一管理,包括告警抑制、告警关联、故障场景洞察等。只有上述底层逻辑结构完善后,才能从业务的角度输出场景,包括预测场景、根源定位场景、智能场景,提高数据处理效率。
在这些场景的加持下,我们可以实现以用户为中心的场景观察,清晰了解业务状态,掌握用户行为在完整业务链条中的状态和数据,实现“知其所以然,知其所以然”。
可观察的智能运维解决方案
总之,六年近百个案例总结出来的解决方案,就是在做好数据管理的前提下,结合统一运维场景,实现统一可观测的运维。杨特别强调,在智能运维建设过程中,应以场景的效用为目标,而不是以技术的实现为终点。
实践-一家华东证券公司
客户痛点
目前手机APP难以形成以用户为中心、以业务为视角的端到端全链路管理体系,难以进行实时链路观察和运维故障排查。
解决方案和结果
该客户的日志数据源和监控数据源通过运维中心统一管理和管理,并进一步应用于完整链路的观察和使用。
在业务健康方面,首先基于业务视角,整合各种监控源的事件,经过智能算法的压缩和去重,得到需要高优先级处理的告警,有效提升一线告警质量;进一步展示当前请求量、请求成功率、TCP连接建立延迟、HTTP请求响应延迟等。通过场景对IDC中异地的POP点,加上业务下沉后客户端的访问数据,了解从互联网线到核心专线的整体扩容补货操作,最终实现对各节点关键KPI的实时计算,对耗时较长或成功率降低的节点的下钻指标和原始日志进行故障判断。
在交易链路健康方面,通过APM将交易序列号串联起来形成痕迹数据,由数据平台统一采集处理,以系统组件为单位展示服务链路整体健康分类查询,实现交易链路实时指标分析和故障排查。数字化浪潮下,智能运维可以帮助证券服务提供有效的备份支持,保障新业务的组合创新,构建数字化风险识别能力,构建以业务场景为核心的健康体系,助力业务运营的稳定高效发展。清科技将不断实现技术创新和产品创新,坚持以客户成功为导向的理念,在客户的数字化转型中提供强有力的帮助。