信息化大运维监控管理平台的方案研究

(整期优先)网络出版时间:2023-12-13
/ 2

信息化大运维监控管理平台的方案研究

李德刚

大庆石化公司保卫部

摘要:当前阶段随着网络覆盖面的基本完全普及以及各种智能设备的增加,基本所有操作都会运用到智能科技手段,导致运维加控管理难度在持续上升。而传统的厂商监控工具已经无法满足需求,甚至会增加一定程度上的负担。在传统工具的运行维护系统中,对于整个系统是进行分散管理的。各有各的管理权限,并且在同级之间甚至无法查阅另一种权限。这种做法会导致的直接后果,就是如果有一个环节中出现了问题,在该环节后面的环节也会出现问题而这些问题在出现后会一起进行报警,因此基本无法断定是从哪一个单一环节所出现问题。极大的增加了日常管理的难度,并且同时也大大降低了出现故障时的处理效率。因此建设一套统筹兼顾及时并且统一的智能运维监控管理平台,是非常有必要的。

关键词:信息化;运维;方案;统一化;监控管理平台

对于系统及时的升级是提升整体运行质量的最基本方式,基于目前的云端存储技术以及大数据分析,将系统进行升级化管理可以有效的解决当前情况下数据量骤升的问题,大大增加系统质量。

一、平台设计理念

平台的设计理念是对目前所有的运维管理功能进行更符合现代要求的升级。包括但不限于集中管理,统一管理,按用户分化,自动处理以及自动寻找问题。让整体的性能提高大大的增加系统的稳定程度,以及减少人工干涉程度,让系统可以在出错的第一时间自动进行问题的查询并且及时上报,让人员在维护系统并且修复故障时可以拥有准确的方向。并且对全部资源进行压缩整理和统一监管,这样一来在各个程序出现问题的时候,并不会让其他程序继续以程序问题继续运行下去,导致所有程序出现问题。统一监管还可以有助于统一规划系统并且统一制定系统标准。在设计时还可以增加一些目前。是对于系统整体运行会起到作用的小程序,例如增加报警数据的管理以及过滤规定,在出现故障时的优先级报错,以及可以多数据进行统一管理的数据存储层。

二、平台设计的方案

对于新型平台的建造大致可以分为七层。分别为数据管理层对设备进行统一运维。数据筛选层对数据的错误以及需要提炼出分析的数据进行筛选。数据应急处理层对数据参数进行统一的调配以及规模分析。数据分享层在此层的数据可以用于传递至互联网云存储当中可以有助于后续对系统改进。区域处理层在此层可以自动将所出现的问题进行统一的规划分类,并且对于数据进行统一的监管与考核,在出现问题后自动进行修复,如果未修复成功,在此层可以及时进行报错处理。运维用户监管层,在次层可以对出现的事件以及错误,在机械自动修复无法完成的前提下,由人工进行修复。最后一层则是最基本的显示层,将所有的参数数据对于进行直观的显示,以助运维人员查阅。

1.数据管理层

在数据管理层中要注意对传统的运维监管系统进行及时的升级,因为当前的设备数量以及所需要处理的数据都照以前大大的增加,如果继续使用传统的运维监控管理系统,那么可能会导致一些处理不及时或者分析资源出现遗漏的问题。因此在整个数据资源层,要注意及时添加设新的设备,实际上内监管系统其实并不需要很大程度上的变革,因为其基本功能的运行都是差不多类似的,所需要注意的就是增加处理分析的模块。因为在处理方式一致的前提下,想要处理更多的数据,需要的就是增加系统的统计以及分类管理能力,在数据进行统一收集的前提下,不会有子系统在为其进行单独的收集,所以想要将所有系统归类整合于一个大的存储空间当中,统一进行数据管理就不能忘记及时对系统的统计以及分类管理能力进行及时升级,并且加大存储空间。

2.数据筛选层

据筛选层是对第一层的基本数据进行筛选,进行最基本的初次筛选,在对数据进行筛选后进行统一的分类。由于曾经的系统是单独分析的,所以在此系统当中,我需要增加的功能就是将其他系统当中的独立筛选系统进行统一整合,变成一个新的大规模筛选系统。并且对筛选出的数据进行一个阙值的分析,判断此阙值需不需要进行报警处理,如果需要的话,将报警数据反馈至下一层进行处理。并且有些数据是单独进行记录的,在筛选过后也要记得对数据的形式进行统一规格的调整调整为适应整体系统的数据,以便于统一进行监管制定管理标准。此数据筛选过程并不需要处理解决数据问题,仅仅只需要将数据进行筛选后,以供系统下一步进行操作。

3.数据分享层数据分享层

数据分享层是在系统当中所最新加入的,其加入目的是基于当前互联网云存储不断升级进化的前提下,已经可以对数据进行大规模的记载,而利用好此技术,将平常数据中所出现的问题进行整理统一分析,就可以分析出系统当中的薄弱部分,对后续运行以及维护和修理都会起到很大的作用。使在后续过程中应对系统出现的问题,可以

做到对症下药。而不是盲目的对系统进行一个普通的维护,可以针对性的进行维护以及修理的话可以大大的减轻运维人员的工作难度,并且大大提高工作效率,这也是新系统升级的一个主要的目的。

4.数据应急处理层

数据应急处理层在概念上来说与数据分享层应该处于平级当中,二者的工作并不冲突,数据应急处理层意图对出现的问题进行分析,对于出现问题的数据,将其提炼出来后,正确地使用大数据对其进行分析,在使用大数据对其进行分析后,如果正常的话则进行备份处理,并不会对其进行上报处理在发现问题后就对其进行统一的上报处理,并且将问题的原因及数据分析后,统一上报于上层系统。

5.区域处理层

区域处理层是将下层中所出现的所有问题进行统一处理并且自动修复的地方,基于下层系统所提供反馈给的数据进行对于问题的具体分类以及具体的形式分析,基于下层系统的升级,可以让区域处理层对数据进行统一的处理分析修复,而不是单独的处理分析以及修复,在大大的增加效率的同时,你也可以对数据参数进行一个大数据的存储传输让此处理层可以营销的,应对以后所出现的问题。而所存储传输的大数据在第一时间将会反馈到云端,处理器中在云端处理器中,可以由上层的工作人员对其进行统一的分析,制定出方案后再将方案反馈至区域处理层中,这样就可以对区域处理层继续实行细化分析处理,并且对于数据处理的时效性也会有很大程度上的保障。

6.运维用户监管层

运维用户管理层就是在普通系统当中的统一用户管理系统,再次管理系统当中所需要做到的事情跟之前是并无很大差异的,而在此系统中所进行的升级,就是对于云端存储的调控能力,由于下层当中会将数据进行在云端的存储处理,因此在此层的工作人员也可以对云端数据进行分析。

7.显示层

显示层则是对监控系统进行最基本的直观显示,与传统的系统也是并无区别的,而在此系统上所新增的功能应该是大数据的分析,这点由下层系统进行向上传递,传递后可以对整个系统基于大数据进行一个全面的分析,对于管理人员来说可以极大程度上提升系统的实效更新以及科学化管理。

参考文献:

[1]吴巧平.福联公司-IT运维体系优化研究[D].吉林大学,2021.

[2]李珏,候朝,薛松.河长制信息化运维管理模式分析[J].广东水利水电.2020,(1).81~86.

[3]冯敏,罗旺,余磊,等.基于无参考质量评估的会议电视运维系统研究[J].计算机技术与发展.2016,(7).187-191.