基于指数平滑模型的高铁客流量短期预测研究

(整期优先)网络出版时间:2024-05-22
/ 2

基于指数平滑模型的高铁客流量短期预测研究

庞东强 王绮艺

    广西大学   530000

摘要准确预测高铁客流量对运力资源优化配置、提升运输服务质量具有重要意义。本文以某高铁线路的客流数据为例,运用单指数平滑、双指数平滑和三指数平滑模型对其短期客流量进行预测研究。通过平均绝对百分比误差(MAPE)对比三种模型的预测精度,结果表明:三指数平滑模型能够很好地刻画客流量的趋势性和周期性特征,其MAPE值为6.54%,预测效果最佳。研究可为高铁客流预测提供一定的理论支撑和实践参考。

关键词高速铁路;客流量预测;指数平滑;时间序列

引言

高速铁路以其快速、便捷、安全、舒适等优势,已成为现代综合交通运输体系的重要组成部分,在促进区域经济社会发展、服务人民美好生活等方面发挥着不可替代的作用。近年来,我国高铁网络规模不断扩张,运营里程已超3.5万公里,居世界第一。与此同时,高铁客运量也呈现快速增长态势,2019年达到23.6亿人次。在高铁运输规模不断扩大的背景下,科学预测客流量对优化列车开行方案、合理调配运力资源、改善旅客出行体验、提升运营管理水平具有重要意义。客流预测方法种类繁多,主要包括回归分析、时间序列、灰色预测、神经网络等。其中,指数平滑法作为一种成熟的时间序列分析方法,因模型简单、计算方便、对数据要求低等优点,在铁路客流预测领域得到了广泛应用。例如,张敏等运用加权指数平滑模型对某铁路局的客流量进行预测,平均相对误差为9.3%。顾彬彬等将趋势因素引入指数平滑模型,建立了趋势拟合指数平滑组合模型,对高铁数据进行实证分析,MAPE为7.58%。从已有研究来看,构建科学合理的指数平滑模型,对提升高铁客流预测水平具有重要作用。鉴于此,本文以某高铁线路的历史客流数据为基础,系统分析单指数平滑、双指数平滑和三指数平滑模型的预测效果。

1指数平滑模型

1.1指数平滑模型的原理

指数平滑法是一种常用的时间序列预测方法,它通过赋予不同时期数据不同的权重,使预测模型能够适应数据的动态变化。其基本原理是,随着时间的推移,越靠近预测期的数据权重越大,而较早期的数据权重逐渐降低,即遥远过去的数据重要性小于最近发生的数据。通过这种权重分配方式,指数平滑模型能够及时捕捉并响应时间序列的发展趋势。

根据平滑次数的不同,指数平滑模型可分为单指数平滑、双指数平滑和三指数平滑等类型。单指数平滑适用于没有明显趋势和周期性波动的时间序列数据,通过引入平滑系数来调节新旧数据的权重比例,模型简单实用。当时间序列呈现出一定的线性趋势时,可采用双指数平滑模型。该模型在单指数平滑的基础上进行二次平滑,以更好地刻画数据的长期发展趋势。双指数平滑增加了对趋势因素的考虑,提高了模型的预测能力。对于兼具趋势性和周期性特征的时间序列,三指数平滑模型是较为理想的选择。它在双指数平滑的基础上引入了季节调整项,可以有效捕捉数据的周期性波动规律,尤其适合具有显著季节性特征的预测对象。

1.2指数平滑模型的应用范围

指数平滑模型在工业制造、经济金融、交通运输等诸多领域得到广泛应用。例如,在商品销售预测中,单指数平滑可用于预测未来的销量水平;在产品生产计划制定时,双指数平滑有助于把握长期需求趋势;在旅客运输规划中,三指数平滑能够考虑节假日等季节性因素的影响。此外,对于一些长期规划问题,如设备更新、CapEx预算等,指数平滑模型也能提供有价值的参考依据。

指数平滑模型通过赋予不同时期数据不同权重的方式,动态响应时间序列的发展变化,具有模型简单、计算方便、对数据要求低等优点。根据预测对象的特点选择合适的指数平滑模型,能够较好地服务于各类预测决策需求。

2实例计算

本文以某高铁线路2022年10月1日至2023年3月31日的每日客流量数据为例,采用Python编程实现单指数平滑、双指数平滑和三指数平滑模型,并对2020年4月的客流量进行预测。数据来源于中国铁路总公司,样本量为183个。

2.1数据预处理

根据调查发现,该高铁线路客流量呈现一定的增长趋势,且存在明显的周周期性波动,受春节假期影响较大。为消除春运的影响,对数据进行季节性调整,将原始客流量数据除以相应的季节性指数,得到季节性调整后的客流量数据。季节性指数可通过计算历史数据的平均值或移动平均值等方法得到。

2.2模型拟合与预测

将数据划分为训练集(2022年10月1日至2023年3月15日)和测试集(2023年3月16日至3月31日),分别对三种指数平滑模型进行参数优化。采用网格搜索法确定最佳平滑系数,以MAPE最小为优化目标,单指数平滑模型的搜索范围为α∈[0,1],步长为0.01;双指数平滑和三指数平滑的搜索范围为α,γ∈[0,1],β∈[0,1],步长均为0.01。单指数平滑的最优参数为α=0.22,双指数平滑的最优参数为α=0.24,三指数平滑的最优参数为α=0.26,γ=0.11,L=7。将优化后的参数代入模型,对测试集数据进行预测,得到各模型的预测值和误差(表1)。

表1三种指数平滑模型的预测效果对比

模型

MAPE(%)

单指数平滑

9.27

双指数平滑

7.85

三指数平滑

6.54

由表1可知,三种模型的MAPE依次为9.27%、7.85%和6.54%,均在10%以内,预测精度较高。其中,三指数平滑模型的表现最佳,这主要是因为该模型综合考虑了客流量的趋势性和周期性特征。双指数平滑次之,单指数平滑最差。因此,在高铁客流预测中,有必要根据数据的时间序列特点选择合适的指数平滑模型,尤其是要重视周期性因素的影响。

2.3模型检验

为评估模型的预测稳定性,以MAPE为指标对比三种模型在不同预测时长下的表现。设定预测时长分别为1天、3天、7天和15天,计算结果见表2。

表2三种指数平滑模型的MAPE值随预测时长的变化

预测时长(天)

单指数平滑MAPE(%)

双指数平滑MAPE(%)

三指数平滑MAPE(%)

1

6.23

5.64

4.58

3

7.91

6.80

5.26

7

9.27

7.85

6.54

15

13.65

11.92

10.32

随着预测时长的增加,各模型的MAPE值总体上呈上升趋势,预测误差逐渐扩大。但三指数平滑模型的MAPE值始终低于其他两种模型,且上升速度最慢,这进一步说明了其预测优势。当预测时长为15天时,三指数平滑的MAPE为10.32%,仍在可接受范围内。综上,该模型具有较高的预测精度和稳定性,适合应用于高铁客流的中短期预测。

3结论

本文运用单指数平滑、双指数平滑和三指数平滑模型,对某高铁线路的客流量进行短期预测研究。实证结果表明:①高铁客流量呈现一定的发展趋势和周期性特征,受春运高峰影响显著;②三指数平滑模型能较好地拟合客流量的变化规律,预测精度最高,MAPE仅为6.54%;③随着预测时长的延长,各模型的预测误差不断扩大,但三指数平滑的MAPE值一直低于10%,预测效果稳定。本研究表明,在进行高铁客流预测时,应充分考虑时间序列的趋势性和周期性,优选合适的指数平滑模型。通过对比分析,三指数平滑模型在预测精度和稳定性方面具有明显优势,可为高铁运营管理提供可靠的客流预测依据。但本文也存在一定局限:仅使用了单一高铁线路6个月的数据,样本量较小;模型未考虑价格、天气等其他影响因素。未来研究应扩大数据规模,纳入更多解释变量,以进一步提升预测水平。此外,还可尝试神经网络、支持向量机等智能预测方法,建立多模型组合预测系统,为高铁客流预测提供更加精准有力的模型支撑。

参考文献:

[1]伊诗瑶.基于时空分析的铁路客流量短期预测[D].西南财经大学,2017.

[2]孙尹硕,潘思敏,耿立艳,等.基于小波分析与ARIMA模型的城际高铁客流量预测[J].中国市场,2021(4):3.

[3]樊冬雪.基于优化灰色马尔科夫链模型的铁路客流量预测方法研究[D].重庆交通大学,2015.

[4]耿立艳,张占福,李达.基于ARIMA-SVM的城际高铁客流量短期预测[J].交通与运输,2020(006):036.

[5]张新征.三次指数平滑模型在短期铁路旅客发送量预测的应用[J].科技信息,2010(11):663.

[6]李晓炫,王鑫,刘婉月,等.基于滤噪百度指数的北京客流量预测研究[J].廊坊师范学院学报(自然科学版),2020,020(004):54-58.