常规检验大数据在胃癌早期诊断中的应用

(整期优先)网络出版时间:2021-03-26
/ 1
摘要目的评估非特异性检验指标组成的预测模型在胃癌早期诊断中的可行性。方法从上海长海医院的电子病案系统数据库中,共纳入2010年1月1日至2019年4月30日的24 615例病例记录,包括10 497例胃癌,5 198例胃癌前疾病, 和8 920名健康体检。通过分层随机抽样,将研究人群分为验证集、训练集和测试集。对所有实验室变量进行数据处理和质量控制后,通过梯度增强决策树、随机森林、支持向量机和人工神经元网络这4种机器学习算法,选择随机森林作为最优机器学习算法和诊断效能分组,使用后向逐步回归法训练数据,构建最佳特征模型采用受试者工作特征(ROC)曲线评价模型的诊断效能。结果本研究建立了由22个常规检验项目组成的诊断模型V22, 诊断早期胃癌的ROC曲线下面积(AUC)为0.808,敏感度为85.7%;特异度为91.9%。对癌胚抗原(CEA)阴性胃癌,V22也显示出较高的诊断准确率0.813,AUC为0.801。结论V22是一个有临床应用价值的胃癌辅助诊断模型,可以很好的区分早期胃癌和由健康组和癌前疾病组成的对照组,对早期胃癌的检出率优于传统的肿瘤标志物CEA。