浙江大华技术股份有限公司,浙江 杭州 310052
摘要:随着视频监控系统的持续发展,无论是设备种类和数量,都日趋繁杂和庞大,管理与应用都面临前所未有的挑战。采用智能运维技术对以往对视频设备、网络设备、服务器、主机、操作系统、存储设备、平台软件等分割管理的信息孤岛进行有效的整合、关联以及智能分析,实现视频全网资源全面监控与集中统一管理,降低人员工作量的同时提高运维人员
关键词:视频监控;智能运维;质量诊断;故障监测
1技术概述
传统视频监控系统缺乏智能运维管理软件,面临设备种类和数量日趋繁杂和庞大,管理与应用都面临前所未有的挑战。智能运维技术将以往对视频设备、网络设备、服务器、主机、操作系统、存储设备、平台软件等分割管理的信息孤岛进行有效的整合、关联以及智能分析,实现视频全网资源全面监控与集中统一管理。
智能运维技术架构包含以层级:
1.设备接入层通过对接视频平台获取前端设备及用户信息,通过运维接入模块可获取视频质量诊断结果数据。IT设备、中间件、应用服务通过SNMP协议及Agent方式接入并采集数据。
2.服务层通过与接入层进行协议交互,通过巡检服务、数据中心、视频质量巡检、快速视频质量巡检、快速拉流质量巡检为应用层提供数据采集服务,包括基础数据及视频、图片质量数据。并对采集到的数据及故障工单数据进行分析、统计、运维知识结构化提取,为应用层提供告警、监控、工单、用户服务、隐患预防、知识库等业务应用支撑。
3.应用层通过调用服务层Restful接口实现设备管理、视频质量巡检、告警监控、设备通道质量监控、报事报修、报表查询、系统级联、态势云图、站点考核等功能、故障隐患研判、运维知识库。
2问题分析
随着视频监控系统的持续发展,无论是设备种类和数量,都日趋繁杂和庞大,管理与应用都面临前所未有的挑战,通过定制标准化、流程化、规范化的管理措施和信息系统成为解决问题的关键,尤其是视频图像监控点位的规范化管理,虽然业内已经有了相关标准基础,但在实际管理和应用仍然存在各种问题,主要有:①前期建设的监控点位信息不全,只定义了通道名称、地址、类型等简单信息,对设备安装时间、设备性质、设备管理组织、经纬度信息等没有进行标准化定义;②监控信息不同步,无法实现信息共享,导致信息孤岛的产生,在一些联合应用中碰到各种问题。③故障隐患研判不足,故障高发点与运维资源投入错位。④缺少知识的沉淀和积累,对于故障的处理过分依赖于运维人员的个人技能,运维人员知识技能、经验要求比较高。
3应用思路与配置
利用智能运维技术,将以往对视频设备、网络设备、服务器、主机、操作系统、存储设备、平台软件等分割管理的信息孤岛进行有效的整合、关联以及智能分析,实现视频全网资源全面监控与集中统一管理,降低人员工作量的同时提高运维人员工作效率,保障业务人员的工作效率,提高业务系统运行状况,进而提高整体管理效益。总体来讲可以带来以下几个方面的效益:①实现了科学化流程管理;②统一管理,问题快速发现;③业务系统运行高效;④减少运维人员工作量;⑤提高运维人员专职技能;⑥为管理者决策提供服务;⑦提升了整体运维服务工作质量。⑧优化运维资源的投入方向的精准度。⑨沉淀了故障处理的知识经验,并促进了知识经验在人员之间的传播,为运维人员在处理同类型故障的时候提供指导。
其中使用的关键技术配置如下:
(1)在线设备自动发现技术
系统通过“全量同步+变更通知”的方式对前端设备获取设备的在线状态,对主动添加的动环设备通过SDK心跳保活的方式获取在线状态,对存储设备/网络设备/硬件服务器是通过SNMP协议实时获取在线状态。可实时发现在线设备,统计在线设备,确保基础台账准确。
(2)故障设备自动监测技术
系统采用智能分析、故障监测及工作流引擎等技术,整合了设备状态检测,以及智能巡检等功能,主动报警提示用户视频设备故障信息,并支持邮件、短信等多重通知方式,为用户提供全方位、精准、高效保障;对于故障信息,提供全流程的报修业务处理,达到规范管理、量化考核的目标,从而最大程度的减少视频监控系统运维的人力成本,提高运行维护水平,保障系统安全可靠运行。
(3)视频质量诊断算法技术
系统通过视频质量诊断算法,能够对前端监控设备获取的视频码流进行分析,利用人工智能技术对视频图像的故障进行精确定位,有利于监控系统及时掌握每个前端相机的工作情况,便于后续对有故障的前端监控设备进行及时提醒,解决人工故障排查带来的低效和滞后问题。可支持检测项包括画面模糊、画面过亮、画面过暗、对比度异常、黑白图像、画面偏色、视频抖动、噪声干扰、条纹干扰、视频丢失、视频冻结、视频遮挡、场景变化、视频剧变以及雪花屏。
(4)案例分析技术
系统基于自然语言分析技术(NLP),对文本进行挖掘分析,通过分类、聚类、信息抽取、摘要、索引、句法语义分析等技术手段,从故障库数据中提取结构化知识,并按照知识库分类要求,对故障案例进行分类归集;同时,基于运维人员对故障案例使用轨迹数据,进行标签标注,根据运维人员日常维护设备类型及处理故障的特点并与历史故障的触发条件数据进行碰撞,分析潜在故障发生的概率,并对发生概率较高的潜在故障隐患进行预警,提醒运维决策人员提前进行故障隐患排查,防患于未然。
(5)集中监控
系统支持监控通道的视频点播状态、巡检时间,进行视频画面截图,支持对视频点播网络时延分析,包括信令时延、码流时延、关键帧时延;
支持视频质量、码流达标性、字幕合规性、录像完整性的检测;
支持勾选通道,进行视频点播状态、视频质量、录像保存天数完整性、录像时长完整性的一键复核,复核完成自动更新监控指标。系统支持监控存储设备的CPU使用率、内存使用率、网卡(上行速率、下行速率)、存储状态、存储使用率、存储空间、存储可用空间等指标;
支持通过SNMP协议监控服务器的CPU使用率,内存使用率、硬盘容量信息、磁盘读写、网口信息(网口名称、通断状态、MAC地址、网口带宽、带宽利用率、上行速率、下行速率、上行利用率、下行利用率、上行丢包率、下行丢包率)、进程信息等监控指标,并可查看近一段时间的历史数据;
支持通过SNMP协议监控交换机的网口信息(网口口名称、通断状态、MAC地址、网口带宽、带宽利用率、上行速率、下行速率、上行利用率、下行利用率、上行丢包率、下行丢包率)、网络延时等监控指标,并可查看近一段时间的历史数据。
4结论
本文主要采用智能运维技术有效解决上海局视频监控系统设备类型多,设备数量大,运维工作量多、管理难度大问题。采用智能分析、故障监测及工作流引擎等技术,整合了视频质量诊断、录像检查、设备状态检测,以及智能巡检等功能,主动报警提示用户视频设备故障信息,并支持邮件、短信等多重通知方式,提供全方位、精准、高效保障;对于故障信息,提供全流程的报修业务处理,达到规范管理、量化考核的目标,从而最大程度的减少视频监控系统运维的人力成本,提高运行维护水平,保障系统安全可靠运行。
参考文献:
[1]郑荣稳.一种基于图像分析的视频质量诊断方法[P].保密科术,2017(10):23-25.