简介:摘要:本研究利用了21年(1999-2019年)的沙坪坝站点探空数据和江北机场雷暴数据,构建了相关数据集。通过客观算法筛选出对雷暴生成敏感的物理量集,并利用主成分分析(PCA)将其降维到8个物理量。将数据按8:2的比例分为训练集和测试集,并使用xgboost决策梯度树、RF随机森林和MLR多元线性回归3种模型对未来12小时和24小时内的雷暴生成进行预测。结果显示,训练集和测试集数据均表明xgboost模型表现最优,其12小时和24小时的回报HSS指数分别为0.3和0.29,高于RF的0.25和0.2,远高于传统线性回归的0.17和0.11,表现出较强的业务应用潜力。