国网湖北省电力有限公司随州供电公司 湖北省随州市 441300
摘要:随着技术发展,电力系统的变电站红外监测系统中,进行红外测温,获取一次设备开关和断路器的温度数据,判别开关的接触电阻是否出现异常,从而判断设备是否需要检修。来实现生产状态监测。本文通过机器学习方法,在监测数据处理中,自动排除由于环境变化因素导致的数据干扰,从而了解设备真实的工作状态。重点工作在利用机器学习的算法进行分析归类,从而排除外部干扰的影响,提高监测数据可信度。在python环境下进行了验证,方法有效可行。对排除外部干扰有明显提升。
关键词:红外成像,机器学习,温度拟合
当前,国家电网在无人值守变电站运维中,电力系统一次设备的运行安全监测,主要靠大量的监测设备来运维[1] [2]。其中,对一次设备的工作温度监测,使用红外热成像仪器测温方法是一种有效手段,通过红外图像处理技术,分析热图,得到对应的温度分布图。从而了解生产设备开关、断路器等接触电阻的状态。
电力一次设备的在线安全监测是智能电网实现自愈控制的智能控制的基础,接触电阻在线安全监测是为了对一次设备进行在线的常规诊断和状态检修的依据,代替传统的计划检修模式,能很好的提高实时性。针对变电站设备因长时间运行和外界因素影响而会出现电力设备接触电阻增大而引发的过热故障,导致事故的发生造成重大的经济损失的问题,需要开展针对一次设备运行状态监测技术的研究,准确判断故障出现的风险,降低经济损失。变压器开关、断路器设备工作状态时,接触点的发热程度和电流大小、接触电阻大小有密切相关。如果触点发生表面金属氧化,会导致其电阻变大,会比正常工况下产生更多的热量,造成接触点的温度上升,进一步造成设备受损。接触电阻严重超标的设备正常运行时因负荷电流小温升并不高,所以很容易被忽略。然而当负荷电流增大或发生外部短路事故时设备运行状况会进一步恶化甚至引发设备事故成为扩大事故的因素。
通常,使用红外摄像机测温,得到的红外图像,或者基于红外图像经过信息处理后提取的温度值,利用这个温度值来判别设备的接触电阻是否正常。由于测量时,受环境变化的影响,例如空气的湿度和温度,雨雾雪气候等原因,相同的红外热成像温度数据,不一定就意味着设备运行状态相同。如果简单通过阈值设定,温度超过阈值,就认为接触电阻过大报警,低于就表示安全,这是不合理的。本文希望通过机器学习的方法,自动排除由于外部环境变化因素导致的数据干扰因素,从而得到正确的设备状态,对设备接触电阻的判断有着很大的实际意义。
在电力变电站一次设备监测应用中,红外测温技术的应用方法主要有四种:第一种是通过红外热成像仪测量设备的表面温度,再结合负荷、环境条件等信息综合判断设备是否发生故障,这种方法是表面温度判断法[3]。第二种是相对温差判别方法,进行相对温差计算,判别是否异常[4]、第三种是温差比较法,是通过计算设备温度上升的幅度或者将被测设备与同类设备对应的部位进行比较来判断设备是否出现故障。第四种是热谱图分析法[5],通过热热谱图像的信息处理,获得有效信息,从而做出判决。表面温度判断法,温差比较法,热谱图分析法,需要事先建立设备的历史谱图,得到比较判别的阈值,用设备当前采集量值,与阈值进行比较,进而判断设备是否存在故障隐患。这种使用阈值比较的方式,因为阈值设置根据历史经验值和设备标称值来确定,无法适应设备运行过程中环境条件的变化,比如,冬天的条件下和夏天的条件下,该阈值应该是明显不一样的,那就需要工作人员根据情况人为设置。存在主观人为控制,不利于自动化无人监测运行维护。人工智能方法是通过设计合适的算法,使智能设备能模仿人类的学习行为,通过利用历史数据,按规则学习掌握知识,并在这基础上强化自己的知识结构,改善自身的性能。机器学习有多种类型[5],比如:监督式学习,输入数据会被特别地标识,通过构建的模型得到输出,并进行验证得到的输出结果是否符合预期值,然后反馈迭代不断完善,在这过程中学习改善模型。常见算法有BP神经网络、逻辑回归等。而另一种,非监督式学习的输入数据不会被特别地标识,智能设备需要分析、学习,对数据进行归纳,然后推理出数据集的内在结构。常见算法有Apriori算法和k-Means算法。还有第三种类型,强化学习,输入数据不仅仅对模型参数进行调整,而且还可以对参数进行调整[6]。强化学习的常见算法有Q-Learning算法和时间差学习等。
如何利用人工智能技术,根据历史的采集数据,通过自学习,完成设备工作温度监测智能化,实现利用监测温度来自动判别设备接触电阻是否正常,是本文重点要解决的问题。
机器学习是人工智能的核心技术,其中决策树是机器学习常见的一种方法,1984年I.Kononenko、E. Roskar和I. Bratko在ID3算法的基础上提出了AS-SISTANT Algorithm,这种算法允许类别的取值之间有交集。1993年,Quinlan提出了一种改进算法C4.5 算法,克服了ID3算法属性偏向的问题增加了对连续属性的处理通过剪枝。2007年房祥飞表述了决策树分类算法,其执行的速度比其他决策树算法快,它对训练样本集的样本数量以及属性的数量没有限制。并且能够处理大规模的训练样本集,具有较好的伸缩性。2000年RajeevRaSto等提出了PUBLIC算法,该算法是对尚未完全生成的决策树进行剪枝,因而提高了效率。XGBoost(Extreme Gradient Boosting)算法是陈天奇博士在Gradient Boosting算法和AdaBoost算法基础上过逐步改进成优化的分布式梯度算法。XGBoost的基本思想是通过利用分类回归树构建监督学习的模型,来进行预测。针对本文的问题,本质上也是通过构建模型,利用训练数据进行学习,通过红外测量温度数据,根据每一个数据的特征值,在模型中训练学习,从而得到接触电阻正常和异常的分类识别。
XGBoost算法是属于监督学习算法,需要建立模型,利用训练数据找出最佳模型参数,通常使用历史测量数据作为训练数据,以判别预测值与测量值的差别,并通过自学习调整到最佳参数,从而实现模型优化。本文面对的一次设备电阻是否正常的判别 问题,也是使用同样的思路来解决。
XGBoost利用的是回归分类树,而监督学习的模型就最简单的线性结构来讲,可以很容易地得到XGBoost模型函数:
(3.1)
式中 表示树的棵数, 表示第 棵回归分类树,全部可能分类树集合为树集合空间。对应的模型参数在训练中获得相应具体值。建立对应的目标函数,目标函数是损失函数项与正则化项之和。用数学公式描述如下:
(3.2)
其中损失函数 用来描述模型的预测值和期待的真实值相比之下的损失程度,一般分类问题中常用的损失函数是对数损失函数:
(3.3)
显然,预测值与测量值越接近,损失函数的误差就越小。那目标函数的输出值就越小。
而 是正则化项,通过对参数的控制,以防止模型的过拟合。由于XGBoost是一个监督模型,因此其对应的模型就是一系列的分类回归树。而最终的预测值就是直接把每一棵树的预测值累加就可以得到。
正则化的目标函数项为:
(3.4)
其中 和 是XGBoost定义的参数,反映期待分类树的简单程度,越大表示越希望获得结构简单的树。当正则化参数为零时,就变为传统的梯度提升树。
学习训练时,每次迭代的预测值都是上一次迭代的预测值(即前面迭代的所有树的和)加上本次用来进行残差拟合的树,即
(3.5)
这时的目标函数将是
(3.6)
为了更快地进行优化,在损失函数中的唯一变量 处进行二阶泰勒展开,并且代入正则函数(3.4),得到目标函数:
(3.7)
其中 。就上面的函数对每一个 进行求导,并令导数为0,可以得到 的最优值:
(3.8)
该函数值的大小便可以用来衡量决策树性能的好坏。
变电站的红外测温量值,包含环境温度、空气湿度、风速和设备表面温度。因此输入向量包括四个维度:环境温度、空气湿度、风速、红外测温。
针对XGBoost算法建模,面对本文的问题,变电站的监测数据是多个影响因子综合形成的测量结果,输入 是一个4维向量, ,令 =风速, =环境温度, =湿度, =设备表面温度测量值。监测数据中,经过算法处理,得到预测温度值,与接触电阻正常下温度值进行比较,量值一致的,表示设备开关的接触电阻正常,不一致的,表示开关接触电阻异常,建议检修。所以,把监测数据训练集,输出其实是排除了外部干扰因素的预测温度值。
1.数据集构成
在某海螺水泥企业的变电站,针对变压器断路器开关,进行现场采集监测数据,使用第三方工具测量方法,得到设备开关的表面温度值作为实际值。然后使用红外热成像测温方法获取多组热图,并通过分析图像计算出被测位置处辐射强度对应的温度值。在获取图像的同时还要测出对应的当时环境的风速、气温、湿度。部分训练的数据集示意数据如下表。
表4.1 温度量值训练集示意表
红外测温 | 风速 | 对比的环境气温 | 湿度 |
11.0 | 0.7 | 12.3 | 70.5 |
12.4 | 0.8 | 12.9 | 74.2 |
9.6 | 0.7 | 10.2 | 68.2 |
10.6 | 0.8 | 11 | 72.1 |
10.3 | 0.8 | 11.1 | 71.1 |
11.8 | 0.8 | 12.3 | 70.9 |
11.2 | 0.7 | 11.9 | 70.5 |
10.1 | 0.9 | 11.2 | 71.8 |
10.8 | 0.7 | 11.6 | 74.5 |
9.9 | 0.8 | 10.6 | 74.5 |
10.6 | 0.9 | 11.5 | 71.1 |
… | … | … | … |
2.仿真验证环境配置
使用Anaconda作为仿真平台,在Anaconda Prompt中下载XGBoost包。将训练集数据通过Excel存为csv格式的文件,保存在python的工作文件目录下,方便python语言环境进行数据读取。
3.参数调整
在XGBoost算法包中包含三类参数,分别是通用参数、booster参数以及学习目标参数。通用参数包括booster、silent、nthread、num_pbuffer、um_feature,设置为默认的即可。booster参数是弱学习器相关的参数,需要不断调试才能使模型有更好的性能。
params =
{
'booster': 'gbtree',
'objective': 'reg:linear',
'gamma': 0.1,
'max_depth':4,
'lambda': 3,
'subsample': 0.9,
'colsample_bytree': 0.7,
'min_child_weight': 1,
'silent': 1,
'eta': 0.01,
'seed':1000,
'nthread': 4,
}
4.温度量值拟合结果
表4.2 监测温度量值算法输出结果
风速 | 环境温度 | 湿度 | 红外测温 | 实际参考温度 | 拟合温度 | 原始温差 | 拟合后温差 |
0.7 | 12.3 | 70.5 | 11.0 | 11.3 | 11.336 | -0.3 | 0.036 |
0.8 | 12.9 | 74.2 | 12.4 | 12.5 | 12.435 | -0.1 | -0.065 |
0.7 | 10.2 | 68.2 | 9.6 | 10 | 10.112 | -0.4 | 0.112 |
0.8 | 11 | 72.1 | 10.6 | 10.9 | 10.821 | -0.3 | -0.079 |
0.8 | 11.1 | 71.1 | 10.3 | 10.7 | 10.775 | -0.4 | 0.075 |
0.8 | 12.3 | 70.9 | 11.8 | 12.0 | 12.102 | -0.2 | 0.102 |
0.7 | 11.9 | 70.5 | 11.2 | 11.3 | 11.285 | -0.1 | -0.015 |
… | … | … | … | … | … | … | … |
通过观察部分训练集的训练结果,所有数据相比红外测温的原始数据误差都有所降低,在上表中,除了两组数据误差绝对值仍大于0.1,其他的误差绝对值均小于0.1。
5.特征分析
在学习模型中,输入数据向量xi包括四个维度:空气湿度、风速、环境温度、红外热成像仪测得的初始数据,红外热成像仪测得的初始数据具有决定性,符合认知。另外三个因素中空气湿度影响最大,风速和环境温度的影响程度偏小。由此,如果在雨雪天气中,红外测温的数据会产生较大的偏差。需要在后期的训练学习中,对这方面数据多加收集。
目前国内外变电站中广泛使用红外热成像测温技术来判断设备故障,但是红外测温数据由于受到环境变化的影响,得到的温度数据很难直接判断设备的开关接触电阻是否正常,需要根据当前状况进行人工判别。本文针对这个问题开展研究分析工作,建立了分类判别的算法,通过机器学习的方法对影响红外测温精度的因素进行排除,获得相对更精确的温度数据。然后使用该温度值进行判别。超过正常阈值则判断为可能具有潜在温度。通过使用python工具,用XGBoost算法进行仿真实验验证为以后的分析工作提供参考。 针对实际情况,尚有以下工作需要进一步研究,目前训练数据中,缺少故障数据,只能使用模拟仿真数据进行验证,还需要在实际应用中继续完善算法。
参考文献
[1] 李波. 红外测温技术在变电站运维中的应用探讨[J]. 环球人文地理,2017,(20): 166-167.
[2] 郑春芳. 浅谈高压开关柜触头温度在线监测装置在神东矿区的应用[J]. 价值工程,2012,(22): 75-76.
[2] 张丹耀. 在线红外测温技术在变电站的应用[C]. 中国电机工程学会第十届青年学术会议·吉林, 2008.
[3] 王文强. 变电站设备运行和故障分析中红外线热像仪测温的应用[J]. 百科论坛电子杂志,2018,(24): 406-407.
[4] 边瑞恩,王青,乔江峰,杨敏. 变电站红外测温技术综述[J]. 机电信息,2016,(18): 106-107.
[5]周志华. 机器学习.北京,清华大学出版社,2016:1-1.
[6]陈海虹、黄彪、刘峰、陈文国.机器学习原理及应用.成都:电子科技大学出版社,2017:2-19.
[7]何清,李宁,罗文娟,史忠植. 大数据下的机器学习算法综述[J];模式识别与人工智能. 2014年04期.
6