自动化运维是一个系统。体系的构建需要循序渐进,有结构,有逻辑,有工具。
目前在互联网运维领域实现自动化运维,多以开源软件为基础,多专业的技术团队协作为支撑,具备专门研究不断出现的新问题和新技术应用的精力、氛围和网络环境。
传统的移动服务存在于非互联网行业。由于自身架构、历史渊源、业务体系等原因,多采用闭源厂商开发的运维系统。但在网络优化升级重组过程中,逐渐向自动化运维靠拢。
运维的概念很宽泛,系统也很复杂。自动化运维的理想范围包括安装自动化、部署自动化、监控自动化、发布自动化、升级自动化、安全控制自动化、优化自动化、数据备份自动化等。基于自动化运维调度引擎,可以完成巡检、性能分析、文件分发、故障诊断等自动化运维任务。
不积跬步,行万里路。运维的趋势是自动化运维,智能化运维,自动化运维是智能化运维的基础。现在各行业的运维建设方案都在向这个目标靠拢,努力逐步夯实基础,从而离智能运维更远。
传统运维升级解决方案推荐
对于运营商、金融、政府、军工、交通、医疗、教育、电力等行业,在自动化运维建设过程中,通过部署运维管理软件厂商推出的智能运维管理系统,可以快速实现自动监控、自动数据采集、自动巡检报警、自动数据分析等基础系统的建立。
以Hydo为代表的HYDO自主研发的智能运维大数据管理平台,在数据自动采集和监控方面取得了显著的成绩,广泛应用于政府机关、科研院所、高校、军工、医疗等诸多领域。HYDO首创大型数据中心统一集中管理、实时监控、安全高效运行、自动化运维。
HYDO涵盖网络、电力环境、IT基础设施、IT硬件、软件、业务系统、视频、云服务等。可以实现各种指标的精确管理和可视化呈现;具有故障自愈功能,开启全天候无人值守模式;打造移动运维解决方案,大幅降低运维成本;基于大数据平台的分析挖掘,搭建Al平台,帮助用户实现智能运维。
HYDO产品技术架构系统架构分为四层:数据采集层、中间调度层、数据存储层和WEB应用层。
数据采集层:采集监控对象的指标数据。
中间调度层:调度数据采集层采集数据,并对采集的数据进行转换、存储和告警识别。
数据层:存储配置信息和调度层处理的采集数据。
WEB应用层:人机交互的数据输入和显示
自动监控中心
01/大屏幕集中实时显示
HYDO智能运维大数据管理平台可以统一集中展示整个机房IT基础设施、基础软硬件设备、业务系统的运行状态,通过扇形图、条形图、折线图、仪表盘等可视化功能组件,帮助决策者、管理者、运维人员快速掌握整个IT设备和系统的运行状态。
监测内容包括:
>系统健康
实时分析计算数据中心所有监控对象和指标的运行数据,通过分析算法综合评估系统整体健康状况并动态展示。
>基本信息
实时显示数据中心所有被管理对象的状态信息,包括被管理对象总数、正常运行次数和停机次数。
实时显示数据中心所有管理对象的指标汇总信息,包括指标总数、正常指标数和告警指标数。
>系统负载
展示实时的系统运行状态信息,包括CPU、内存、磁盘空的使用情况,以图形的形式展示网络流量等运行数据的变化趋势和波动情况。
> TOP3动态显示
实时显示CPU使用率、内存使用率、网络流量使用率前三位的管理对象信息,以视图的形式显示各个指标值和设备名称,让维护人员实时了解重要设备关键指标的峰值。
>存储间的动态显示空
监控主机磁盘/存储设备的存储空空间的使用情况,以柱状图的形式显示每个存储对象的总空空间、已用空空间和剩余空空间。
>定制显示
HYDO系统可以根据不同的业务场景和显示需求,提供定制化设计开发的大屏幕,用于呈现各种业务状况和设备运行信息。
02/视觉综合显示
通过各种可视化方式,从多个角度、多个维度对整个IT系统的运行情况进行全面、综合、集中的监控和展示。为信息中心的不同岗位和人员提供不同的管理视图,包括告警概览、告警分析、告警信息排名、关键业务系统健康度、网络设备性能排名、线路流量排名、主机设备性能排名、巡检统计排名等基础设施运行统计的概览。
03/拓扑视图监控
HYDO智能运维大数据管理平台可以快速、高效、准确地搜索整个数据中心的各类管理对象,包括网络设备、安全设备、服务器、虚拟化等。,自动生成拓扑结构并提供拓扑报告。
>网络拓扑
系统可以自动发现数据中心的网络设备以及它们之间的连接规则,自动生成网络拓扑,并按照连接规则进行有序排列。网络拓扑图可以呈现设备告警信息、基本信息、状态信息、面板信息等。,并可用于远程测试、远程登录等操作。
>系统拓扑
根据业务逻辑关系自动和手动生成系统拓扑图。系统拓扑图可以显示操作系统/数据库/中间件/业务系统的关系、告警信息、基本信息和实时运行情况,为主机管理提供全面的状态信息和运行数据。
>虚拟化拓扑
虚拟化拓扑清晰展现主机、虚拟机、虚拟存储、网络之间的关系,实时呈现运行状态、性能信息、告警信息、基础信息等数据信息。
某大学网络拓扑图>机房拓扑
全方位展现机房整体布局,包括机柜显示、设备分布、动力环境设备位置及状态,实时显示温度、湿度、漏水、UPS、电池、电源、烟雾、门禁状态等指标值。
>业务拓扑
以业务系统的建设和问题分析为导向,将原来离散的设备、应用、中间件、数据库和基础设施自动整合成清晰严谨的业务系统架构。通过业务系统拓扑图的性能分析,可以关联和分析系统各组件的性能问题。
业务拓扑图04/资源概览视图
HYDO智能运维大数据管理平台实时显示所有资源组的运行状态,还可以单独查看某个资源组的详细运行信息。资源是根据管理或业务需求创建的组,由一台或多台主机组成。创建资源组使运维管理变得简单,将每个人或部门负责的设备和服务以组的形式呈现出来,分工明确,职责分明。
05/不同地方的分布式监控
HYDO智能运维大数据管理平台通过跨区域分布式扩展模式,实现对不同站点的集中统一监控,对各站点的各种设备和服务进行有效监控和告警,提高整体管理效率,降低系统运维的强度和复杂度。
自动数据收集
01/网络设备的数据采集和监控
全面管理网络,实时显示网络系统的各种性能数据。
>基本信息
查看实时网络设备的基本信息,包括品牌、型号、配置、运行时间、设备面板、端口状态、线路状态和连接等。
>性能分析
实时显示所有设备的性能信息,如CPU负载、MEM利用率、线路流量、帧流量等。
>网络测试
通过PING、SNMP、TELNET等测试工具对单个节点或IP区间进行批量测试。
>无线管理
无线AC和AP设备的统一管理,包括无线设备自动发现、状态管理、拓扑生成、在线AP号、离线AP号、告警管理等。
02/服务器数据采集和监控
支持主流操作系统的实时监控;支持实时监控CPU性能指标、内存工作状态、硬盘、网口状态、流量、系统状态、主进程等。
03/存储设备的数据采集和监控
实时监控和管理主流存储厂商的磁盘阵列和磁带库设备,包括设备运行状态、网络连接、磁盘运行状态、控制器状态、总存储空空间、空空闲和占用空空间等。
04/IP节点数据采集和监控
>打印机监控
支持多品牌打印机的监控。监控指标包括:设备运行、网络连接、纸张/墨水短缺等。
>摄像机监控
实时监控和管理摄像机的运行状态、网络连接和视频质量。
05/虚拟化数据采集和监控
实现对虚拟环境中主机、虚拟机、虚拟存储、集群、资源池、虚拟交换机等对象的性能、状态和告警的实时监控,支持以拓扑图和列表的形式集中显示每个被管理对象的监控指标,包括基本信息、运行信息、CPU负载、MEM利用率、主机硬件状态、数据存储容量和使用房间空;提供虚拟化报表统计功能,包括运行状态统计分析、性能统计分析和告警统计分析报表。
06/IPMI硬件数据采集和监控
支持服务器硬件的带外管理,通过IPMI协议实时显示IPMI硬件的状态信息,包括硬盘、温度、风扇、电源、内存、CPU等指标,并提供开关机操作。
07/数据库数据采集和监控
支持Oracle、SQL、MySQL、DB2、达蒙等主流数据库的监控和管理。,包括:运行状态、连接数、并发、数据库日志监控、缓存监控、索引信息监控、库缓存监控、监听器监控、进程监控、回滚段监控、实例监控、会话监控、实例性能信息监控、SQL语句执行状态监控、日志监控和table/[/K0。
08/中间件数据采集和监控
支持对WebLogic、Websphere、Tongweb、Tomcat、Apache等主流中间件的实时监控。,包括对中间件运行状态、性能、通道、队列信息、线程、事务信息、连接池状态、连接数、最大连接数、会话数等指标的监控。
09/应用性能数据采集和监控
支持对HTTP、HTTPS、FTP等主流应用的实时监控。,包括应用状态、进程状态、进程占用的资源、下载速度、最大延迟、最小延迟、平均延迟、端口状态等指标;支持对网页运行状态和网页篡改的实时监控和报警。
10/定制的数据采集和监控
提供定制化的服务监控和管理,如电子政务、OA、ERP、HIS、MES等业务系统。监控指标可以定制,包括服务运行状态、端到端响应时间、与业务/应用相关的资源对象的性能和故障等。
自动检测和报警
01/自动预警和报警
HYDO智能运维大数据管理平台采用灵活、清晰、高效的报警策略。经过多年的应用和改进,它具有完善的报警功能。支持用户自定义设置报警阈值、报警条件、报警级别等指标,并提供多种报警方式,如微信、邮件、短信、网页、声光等。
02/自动发现IP地址
可以自动发现全网环境中的IP,实时显示IP地址的使用情况,及时发现和提醒新增的IP地址,跟踪IP历史,并具有端口的开放和关闭功能。
03/日志自动收集和分析
支持接收和分析Syslog和文本日志,灵活设置接收对象、等级和关键字筛选,自动记录所有被监控主机和服务的状态变化,并按关键字进行告警提醒,方便管理人员查看和统计告警历史,分析和定位系统故障。
04/自动巡逻检查
提供智能巡视功能,可自定义巡视项目、巡视周期等参数,提供自动巡视和手动巡视两种模式。检查完成后,系统会自动生成图文并茂的检查统计报告,并能主动推送至负责人邮箱。
05/配置自动备份和比较分析
HYDO智能运维大数据管理平台提供网络设备配置文件定期备份功能,可以备份TFTP各品牌、各类型设备的配置文件。可以灵活设置备份任务、备份周期、备份数量,支持配置文件自动对比分析,在配置信息发生变化时可以及时报警。
自动化统计分析
01/自动统计报告
提供各种类型图表的可视化显示,可以帮助用户分析网络、主机、服务等各种被管对象的运行状态。,并提供专业的分析方法。同时,系统提供历史数据的查询和导出,方便管理者直观、多角度地掌握IT资源的整体运行状态。
02/运维大数据分析
HYDO智能运维大数据管理平台自动采集监控对象的运行日志,实时监控响应时间、服务质量、网络状态、网络流量、性能指标、故障频率、安全指标,对海量数据进行关联、挖掘和分析,全面展示数据中心的运行状态和薄弱环节,给出预警、提醒、运行优化和规模扩展建议。
标签
社会化分工和精细化分工是进一步提高专业能力和生产效率的必然趋势。目前各行业的专业细分和协作如蛛网般密集有序,范围正在进一步扩大。运维行业也是如此。各行业的运维团队只需要专注于保证内部业务稳定顺畅,保证和提高业务系统的运行效率。
传统的运维管理软件仍然是非常重要的一部分。传统基础设施体积庞大,系统复杂,对私有基础设施部署的需求依然存在。IT系统的建设和优化是一个不断发展的过程。自动化运维各个细分领域的需求不断产生,运维服务的解决方案也层出不穷。目前的趋势表明,IT运维服务与关键业务已经成为一体或不可分割。运维管理任重道远。
让操作和维护更简单,数据更安全,www.haoyueweiye.com