摘要
摘要目的探讨基于自动乳腺全容积成像(ABVS)影像组学的机器学习模型鉴别乳腺影像报告和数据系统(BI-RADS) 4类病灶良恶性的临床价值。方法前瞻性收集2020年5-12月于西南医科大学附属医院(中心1)和广东省中医院(中心2)接受ABVS检查和组织活检的BI-RADS 4类病灶患者,分为训练集(中心1)和外部验证集(中心2)。将病灶的最大切面图像(ABVS横切面、矢状面和冠状面各一张)导入影像组学分析软件(MaZda),并提取影像组学特征。在训练集,七种特征选择方法和十三种机器学习算法进行两两结合,构建不同的机器学习模型,将诊断性能最优的六种模型在外部验证集进行验证并确定最终的机器学习模型。最后,评估有或无模型辅助下不同经验超声医师(R1、R2和R3,分别有3、6和10年经验)诊断效能和诊断信心的变化。结果①研究纳入251个BI-RADS 4类病灶,其中训练集178个(良性91个,恶性87个),外部验证集73个(良性44个,恶性29个);②训练集中,诊断性能最优的六种机器学习模型分别是基于递归特征消除(RFE)的深度神经网络(DNN)模型,自适应提升(AdaBoost)模型,逻辑回归(LR)模型,线性判别分析(LDA)模型,集成算法(Bagging)模型和支持向量机(SVM)模型,ROC曲线下面积(AUC)依次为0.972、0.969、0.968、0.968、0.967和0.962;③外部验证集中,DNN-RFE模型仍具有最优的诊断性能,其AUC、准确性、敏感性、特异性、阳性预测值(PPV)和阴性预测值(NPV)分别为0.886、0.836、0.934、0.776、86.8%和82.5%;④模型辅助前,R1的诊断性能最差,其准确性、敏感性、特异性、PPV和NPV分别为0.680、0.750、0.640、57%和81%;模型辅助后,R1的上述指标分别提升至0.730、0.810、0.930、68%和94%,差异有统计学意义(P=0.039),而R2和R3与辅助前比较,差异无统计学意义(P=0.811,0.752);三名医师的总体诊断信心从2.8增加至3.3(P<0.001)。结论基于ABVS影像组学的机器学习模型能较好地区分良恶性BI-RADS 4类病灶,提升经验较少医师的诊断性能及其诊断信心。
出版日期
2023年03月15日(中国期刊网平台首次上网日期,不代表论文的发表时间)