山东汇成电力工程有限公司 山东农业大学 山东省泰安市 271000
摘要:利用太阳能进行光伏发电已成为重要的可再生能源技术,其具有噪声小,零污染,安全性强的表征。光伏发电相对于风力发电与水力发电,成本更低,建设周期更短。但是光伏发电功率经常会出现不稳定的情况,受到外界环境因素的影响,这给国家电网的调度安排带来了极大困难。因此对光伏发电功率进行稳定准确的预测便显得紧急迫切起来。本文给出了一种基于极限学习与短时记忆网络的光电功率预测方案,可以方便独立光伏发电站的并网建设,降低电网运行出现风险的概率。
关键词:光光发电;功率预测;长短时记忆模型;相似日分析
引言:
随着全球环境问题愈来愈严重,研究开发可再生能源已经成为受全球各国重视的发展问题。光伏发电作为今后百年可以代替火力发电的重要发电方式,具有绿色环保无污染的表征。光伏发电通过利用传感元件的光伏特性,将光能转化成电能进行储存传输。谈及发电自然离不开对其输出功率的预算研究。由于光伏发电依赖于外界环境因素较强,诸如光照强度,温度,风速,湿度等都会对发电的输出功率造成影响,因此光伏发电具有随机性与混乱性,运行过程具有间歇性。
一、光伏发电功率预测模型简介
2019年,学界对光伏发电功率预测总结了三类预测模型。即物理预测模型、统计预测模型和机器学习预测模型。物理预测模型又分为NWP(numerical weather prediction)、TSI(Total-sky image)和SI(Satellite image )。物理预测模型根据大数据分析与数理计算,对自然数据与大气数据进行时间序列的相关性分析,准确性较强,但是在外界环境不稳定的情况下,此种传统计算由于受到时间延滞性影响,功率预测计算结果会有较大误差。统计预测模型相比于前者,适用的环境情景更多样,但是统计预测模型有一个弊病,就是在较长时期的光伏发电中,无法与有效的进行非线性预测,所测数据大多数是线性拟合的。机器学习预测模型,则是目前较为优秀的预测模型,兼顾了前两者的优点,通过数据挖掘与数据特征量的提取,对大量环境数据的输入输出量进行分析,从而科学的预测出线性与非线性的发电功率情况。
二、长短时记忆网络模型工作情况
由于机器学习模型中的传统前向神经模型很难训练,本文采用了改进后的神经玩过学习模型,即循环神经网络中的一种——长短时记忆网络模型。由于循环神经网络中的误差项沿时间传播的公式存在指数项,当数据趋近于无限大时,此误差项会无限增大或者无限减小至消失。这种情况被称之为梯度消失或者梯度爆炸,当对角矩阵与矩阵的模的乘积小于1时,称之为梯度消失;反之,二者乘积大于1时,被称之为梯度爆炸。为了得到比较准确的功率预测模型,本文希望二者乘积可以趋近于1。本文选用长短时记忆网络模型的思路也很明显,就是为了弥补数据较多时误差项带来的爆炸性增减。由于原始循环神经网络中的隐藏层只有一个h,它对短期的输入非常敏感。现在对此模型再增加一个隐藏层c,使得此模型面对长期记忆使也可以敏感反映,这样就弥补了原有模型的缺陷。
现在还有一个重要的问题,就是如何控制长时记忆的状态转变与维持。我们通常将新增添的隐藏层称之为单元状态。对于单元状态的长期控制,通过三步进行。首先,需要一个开关保持长时记忆的状态;其次,需要一个开关控制即时状态输入至长时记忆状态;最后,要设置一个开关控制长时记忆状态的输出。当数据过多时,需要对数据进行记忆清除,使用Sigmoid函数选择数据的清除情况。具体状态过程如图所示:
三、功率预测方法分析
对功率预测模型确定下来后,进而研究功率预测的分析方法。由于功率预测时间花销很大,在预测时很多参数会出现不稳定的情况,本文采用相似日分析方法来对比测量日与历史日之间的相关性。相似日分析法是通过对多种环境因素因子进行分析,诸如大气成分;温湿度;光照强度等,利用数学公式分析曾经稳定时的观测数据与当日观测数据的稳定拟合情况。此分析方法通过皮尔逊相关系数(Pearson correlation coefficient, PCC )进行表征。当此系数愈来愈接近1时,相关程度就越强,稳定性也就越高。此系数如下所示:
在此式子中,N表示观测日的采样种类数,x与y分别代表观测日与历史日的观测数据结果。如果这个系数的计算值贴近零,相关性就减小,证明当日的数据是极端数据,要进行特殊的电网调配工作或者检修。当计算值等于0时,说明当日所测值与正常值完全无关,可以剔除出机器学习的数据库。
四、功率预测研究方案
光伏系统的输出功率情况受天气条件的影响很大,环境温度、水平 辐射量、水平扩散辐射量、光照时长和风速都会影响结果的测量。本文的预测方案选取了大气预报中较为常见的气象信息,即日最高环境温度、日最低环境温度、日平均环境温 度、日平均水平辐射量和日平均扩散辐射量作为气候因子,进行相似日分析的预测。
基于相似日分析方法和长短时记忆的光伏发电功率预测模型详细过程如下:
步骤1:采集往日数据。收集光伏系统的历史输出功率值输入功率值以及所采用的那五个气象因子信息。
步骤2:根据时间筛选信息。对当日6: 00至18: 00的时间分为12段,每小时的整点时间作为一个单位,筛选出输出功率值以及5个气象因子数据。其中5个气象因子为日最高环境温度、日最低环境温度、日平均环境温 度、日平均水平辐射量和日平均扩散辐射量。
步骤3:相似日分析。釆用PCC衡量五个气象因子的情况,计算出目标预测日与历史日之间的气候相似性。对计算数值进行分析后,选取PCC值贴近1的200个每日数据作为相似日的数据库。
步骤4:分配数据。将100个相似日中稳定性最强的数据,即5个气象因子数据和最佳相似日前一日的20个光伏系统输出功率值作为深度学习神经网络的输入值,以预测目标日的光伏输出功率。此外,剩余的100个历史相似日作为训练数据,并从中任意选取30日作为验证集。
步骤5:处理深度学习数据。将参考集合中的一百个数据统一整合,标明原始数据库的最大值与最小值。
步骤6:随机分配极限学习机的初值,即隐藏层的阈值和权值。
步骤7:利用训练集对极限学习模型进行训练。
步骤8:判断是否满足收敛条件,并对所测数据进行评估。
五、工作小结
本文采用相似日分析与长短时记忆模型对光伏发电功率预测问题提供了一个新的解决方案,相比于传统方法降低了参数的不稳定性,提高了预测的准确性,对电网调配工作与光伏发电站的并网改造具有参考价值。
参考文献:
中国电科院新能源研究所副所长 刘纯 电力规划设计总院规划研究中心副处长 韩小琪 南方电网科学研究院副研究员 雷金勇.风电功率预测将有效提高风电利用率[N].中国电力报,2012-09-27.003.
刘燕华;李伟花;刘冲;张东英.短期风电功率预测误差的混合偏态分布模型[J].中国电机工程学报,2015,35(10):2375-2382.单晓光,张莉.自动驾驶汽车的专利竞争格局研究——基于中、美、日、德的专利数据分析[J].中国发明与专利,2020,17(1):35-40.
闫鹤鸣;李相俊;麻秀范;惠东.基于超短期风电预测功率的储能系统跟踪风电计划出力控制方法[J].电网技术,2015,39(02):432-439.):1-9.