简介:模型的验证是指对模型的性能指标(区分度、校准度)进行考察的过程。根据考察过程中是否使用预测模型的开发队列数据,模型验证可分为内部验证和外部验证。内部验证是检验模型开发过程的可重复性,常见形式包括随机拆分验证、交叉验证、Bootstrap重抽样以及“内部-外部”交叉验证。外部验证考察的是模型的可移植性和可泛化性,常见形式包括时段验证、空间验证以及领域验证。
简介:摘要:随着大数据趋势的流行,数据驱动模型在配电网中变得越来越重要,为了预防故障因素对配电网可靠性的冲击,本文根据杭州电网在五年间收集到的故障信息,提出了一种基于数据驱动模型的配电网天气相关故障预测和诊断方法。通过将历史故障数据和历史气象观测数据进行关联性比对,得到气象变量和故障信息的训练数据集,通过线性判别分析法对该数据集进行分类训练,生成了故障预测模型。最后通过将气象数据的测试集代入预测模型,进行故障概率预测。本文实验验证了该方法的有效性。
简介:目的:探讨卵巢肿瘤风险预测模型(ROMA)在卵巢肿瘤诊断中的应用价值。方法:回顾性分析因卵巢肿瘤住院接受手术的良性肿瘤患者41例,恶性肿瘤患者42例及正常受试者40例,用ELISA法检测血清中HE4与CA125水平,计算ROMA值以评估患卵巢肿瘤的风险性。结果:卵巢肿瘤组患者血清HE4、CA125水平及ROMA值高于对照组和良性肿瘤组,差异有统计学意义(P〈0.01)。良性肿瘤组CA125水平值高于对照组值,差异有统计学意义(P〈0.01);而HE4水平及ROMA与对照组比较差异无统计学意义(P〉0.05)。以HE4≥150pmol/L,CA125≥35U/ml作为阳性界限,则HE4、CA125及ROMA值敏感度分别为83.33%,69.04%85.71%;特异度分别为95.12%,78.0%,95.12%。CA125ROC曲线下面积(AUC)为0.676;HE4ROC曲线下面积(AUC)为0.749;ROMAROC曲线下面积(AUC)为0.814,与CA125、HE4比较差异有统计学意义(P〈0.05)。结论:在卵巢肿瘤诊断中,单项检测HE4的临床价值优于CA125。对于单项HE4、CA125检测而言,HE4、CA125联合应用计算ROMA值具有更好的诊断卵巢恶性肿瘤的临床价值。
简介:摘要商品住宅价格受多个因素的影响,本文以海南主要城市海口、三亚2017年的相关数据为基础,建立起基于灰度预测的商品住宅价格主成分回归模型解决如下三个问题。
简介:摘要:随着社会的进步与发展,交通强国战略的提出,使得交通在生活中占据重要地位。为了解决各类交通问题,在交通网络日益复杂的情况下,交通流预测成为智能交通系统的热门领域,因为准确的交通流预测,有利于提高交通运行效率。本文从社会交通流量增加的大背景出发,阐述当前较为常用的交通流预测模型,分析得出使用综合模型进行交通流预测是效果较好的方式,要想得到可靠的交通流数据就要提高预测的精度和准确度。
简介:以某地市电信企业的客户为目标用户群,结合电信行业的业务规则,利用SPSS公司的数据挖掘工具Clementine,运用数据挖掘中的CRISP—DM模型方法建立了客户流失预测模型,为电信企业对流失客户采取更有效的营销策略提供一些建议。
简介:为消除Bayes动态模型中噪声的正态性假定对模型的实用性的限制,在Bayes整体风险最小的准则下,建立了非正态Bayes动态模型状态参数向量纳向前m步Bayes最优线性预洲及其风险矩阵的循环递推方程,使正态Bayes动态模型的相关结果成为其特例。该方法可以在较大程度上拓宽Bayes动态模型及其Bayes预测的适用范围,有一定纳理论意义和实用价值。