简介:摘要目的探讨人工智能算法模型在创伤患者下肢静脉血栓栓塞症(VTE)诊断中的预测效能。方法回顾性收集1992年12月至2017年11月中国人民解放军总医院信息系统数据库中骨折手术患者资料,共15 856例。按照患者有无血栓将其分组,并进行数据预处理和特征提取。选择随机森林(RF)、贝叶斯(Bayes)、决策树(DTC)及梯度提升树(GBDT)4种常用算法构建VTE风险预测模型,根据院内患血栓与否进行随机分层抽样,将原始数据按8∶2的比例分为训练集和测试集。通过比较上述方法中受试者工作特征曲线(ROC)下面积(AUC)、真阳性率(TPR)和精确度,评估不同模型在VTE临床诊断中的效能。根据研究特征在模型中的贡献程度进行重要特征排序,筛选VTE的重要预测特征。结果RF、Bayes、DTC和GBDT模型AUC分别为0.89,0.86,0.68,0.71,TPR分别为0.29,0.44,0.38,0.66,精确度分别为0.97,0.94,0.95,0.76;其中RF模型AUC最大,精确度最高。对各VTE人工智能预测模型的重要特征分析表明,血栓病史可以作为不良结局的首要预测因素。RF模型重要临床特征排序为:血栓病史、依诺肝素钠注射液剂量、最后一次葡萄糖测定结果、术后首次葡萄糖测定结果等。结论RF模型在创伤患者VTE风险预测中的精确度最高,能够为VTE预防策略制订提供参考依据。
简介:摘要目的应用深度学习算法建立基于纸质版12导联体表心电图的人工智能模型,评估并比较其与心律失常专科医生对流出道室性心律失常起源部位定位的效能。方法收集2011年5月1日至2020年12月31日在首都医科大学附属北京朝阳医院、温州医科大学附属第二医院、浙江大学医学院附属邵逸夫医院、北京大学第三医院经射频消融术成功治疗的527例流出道室性心律失常患者的861份纸质版室性心律失常心电图。以术中成功消融靶点作为金标准,对以深度学习为基础的人工智能模型进行训练、验证及测试。两位心律失常专科医生根据经典定位流程图及临床经验对测试集心电图进行靶点判断。对比深度学习算法与人工判读的敏感性、特异性和准确性等。结果基于纸质版常规12导联体表心电图的扫描图像建立的人工智能模型的灵敏度、特异度、准确率、受试者工作特征曲线下面积、F1指数分别为94.0%、83.3%、93.0%、0.93和0.96。针对测试集,专科医生判读的平均灵敏度、特异度和准确率分别为95.7%、83.3%和94.6%。结论在流出道室性心律失常起源定位方面,基于纸质版心电图的深度学习算法表现出较高性能,与心律失常专科医生的判断水平相当。
简介:摘要目的探讨Eclipse13.6中剂量体积优化算法(DVO)和光子优化算法(PO)在左侧乳腺癌根治术后调强放射治疗计划中的剂量学差异。方法选取左侧乳腺癌根治术后放疗病例20例,并由同一名医生勾画靶区和危及器官。保持处方剂量、射野设置、优化参数不变,分别用PO和DVO算法优化,并统一用各向异性解析算法(AAA)进行剂量计算。比较两种优化算法在靶区剂量、适形度指数、均匀性指数、危及器官受量和机器跳数的差异。结果两种优化算法均基本能够满足临床要求。两种优化算法心脏平均剂量(Dmean)差异无统计学意义(P>0.05);PO算法在靶区D95和最大剂量(Dmax)、均匀性指数、适形度指数、机器跳数、心脏V30和V40、脊髓Dmax等方面均优于DVO算法,而患侧肺V5、V20和Dmean稍劣于DVO算法(均P<0.05)。结论对于左侧乳腺癌根治术后放疗计划,在不损失靶区受量情况下,选用PO算法可提高靶区适形度,降低心脏受量,加快计划执行速度。
简介:摘要目的评价深度学习重建(DLIR)算法结合低管电压技术相对于自适应统计迭代重建(ASiR-V)算法对腹部增强CT动脉晚期图像中微小动脉的显示情况。方法前瞻性收集2021年12月至2022年1月就诊于北京大学人民医院需排查腹部疾病并接受腹盆腔增强CT扫描的患者。根据CT扫描不同管电压以简单随机法将患者分为80 kV低管电压(LV)组和120 kV高管电压(HV)组。根据不同重建算法,每组再进一步分为DLIR-H(D)和ASiR-V 50%(A)2个亚组。对患者进行CT增强扫描时均采用自动管电流调节技术,噪声指数统一设置为9。对重建层厚为0.625 mm的动脉晚期图像进行主观评价和客观指标评价,并记录动脉晚期扫描的辐射剂量。结果共纳入168例患者,其中男76例,女92例,年龄18~85(53±15)岁,体质指数(24±3)kg/m2;LV组91例、HV组77例。LV组主动脉和肝总动脉CT值明显高于HV组(t=-14.20,P<0.001;t=-0.95,P<0.001)。管电压相同时,D亚组动脉晚期图像噪声明显低于A亚组,肝脏、主动脉、肝总动脉信噪比(SNR)和对比噪声比(CNR)均明显高于A亚组(P均<0.001)。LV-D亚组中主动脉和肝总动脉SNR和CNR明显优于LV-A、HV-D、HV-A亚组(P均<0.001)。腹部血管显示的主观评价方面,LV-D亚组肝总动脉、肠系膜下动脉、左结肠动脉升支边缘的空间分辨力以及左结肠动脉升支对比度均显著优于LV-A、HV-D、HV-A亚组(P<0.05),脾区边缘动脉显示率(54.9%,50/91)显著优于HV-D(24.7%,19/77)和HV-A亚组(32.5%,25/77)(校正后P<0.05)。LV组与HV组间有效辐射剂量分别为(4.91±1.97)、(5.43±1.78)mSv,差异无统计学意义(P>0.05)。结论低管电压技术结合DLIR算法的腹部增强CT扫描能够有效提升肠系膜下动脉发出的左结肠动脉升支及脾区边缘动脉的显示水平,为类似微小血管的评估带来更多的可能性。
简介:摘要目的利用反向传播神经网络(BPNN)算法,建立一种可以识别血糖项目随机误差的实时质控新方法并评价模型效能。方法通过北京朝阳医院实验室信息系统导出2019年1月至2020年7月在西门子advia2400分析系统上报告的全部患者血糖信息,共计219 000条,作为本研究的无偏数据。人为引入6个偏差生成相应的有偏数据,每种偏差下用2种算法测试。进行计量学及临床评价。结果BPNN步长设置为10,全部偏差下假阳性率均在0.1%以内;MovSD的最佳步长为150,拦截限为10%,全部偏差下假阳性率为0.38%,比BPNN高0.28%。MovSD在0.5与1误差因子下全部未检出,误差因子>1之后,可检出,但MNPed偏高;而BPNN在全部偏差下MNPed均低于MovSD,两者相差最高达91.67倍。计量学溯源过程生成460 000条参考数据,采用参考数据评定BPNN模型的不确定度仅为0.078%。结论成功建立了基于BPNN算法识别检测过程随机误差的实时质控方法,模型准确度高,临床效能显著优于MovSD方法。
简介:摘要目的研究PTW729二维矩阵电离室验证Acuros BV算法在相对剂量分布计算方法的可行性,分析该方法的优势和劣势,为实际临床工作提供参考。方法基于自建测量模体,在相同计划和测量条件下,使用PTW729和胶片方法,分别测试相同位置处的剂量分布,对两种方法的测量结果和Acuros BV算法计算结果分别进行γ比对分析,并测试PTW729方法的稳定性。结果PTW729和胶片的测试结果与Acuros BV算法计算结果的γ比对值分别为98.9%、95.9%,PTW729与胶片测试结果的γ比对值为88.0%。PTW729稳定性测试实验γ比对值分别为95.0%、100.0%、100.0%。结论PTW729二维矩阵电离室可应用于Acuros BV算法相对剂量分布的快速验证。
简介:摘要目的探讨鼻窦CT扫描中,前置和后置自适应统计迭代重建算法(ASiR-V)对图像质量和辐射剂量的影响,并寻找最佳的迭代组合。方法以1具离体头颅标本为研究对象,采用临床鼻窦CT常规扫描条件[噪声指数(NI)=8],以及前置ASiR-V的不同等级(0~100%,间隔为10%)进行螺旋扫描,所得原始数据使用后置ASiR-V的不同等级(0~100%,间隔为10%)进行骨算法和标准算法重建,共获得242个鼻窦薄层图像序列。选择特定的感兴趣区(ROI)测量CT值,并计算图像对比噪声比(CNR)和品质因子(FOM)。记录容积CT剂量指数(CTDIvol)和智能毫安(Smart mA)值。采用线性回归分析对ASiR-V各等级与对应的CTDIvol、Smart mA、CNR、FOM进行比较分析。采用配对t检验对相同后置不同前置ASiR-V骨算法和标准算法图像的CNR进行分析比较。主观评价采用双盲法由3名高年资放射诊断医师以4分法(4分为最佳)进行图像质量评分。结果随着前置ASiR-V等级(0~100%)的增加,Smart mA、CTDIvol均减低,呈线性负相关(r分别为-0.981、-0.976,P均<0.001);Smart mA降幅为72.05%,CTDIvol降幅为71.22%。前置ASiR-V相同,随后置ASiR-V等级增加,骨算法和标准算法图像对应的CNR呈上升趋势,呈正相关(骨算法图像:R2分别为0.976、0.992、0.982、0.982、0.975、0.975、0.979、0.996、0.952、0.978、0.965;标准算法图像:R2分别为0.944、0.990、0.988、0.993、0.996、0.987、0.984、0.996、0.996、0.990、0.965);后置ASiR-V相同,随前置ASiR-V等级增加,骨算法和标准算法图像对应的FOM呈波动变化(骨算法图像:R2分别为0.335、0.341、0.344、0.364、0.385、0.405、0.418、0.429、0.455、0.474、0.516;标准算法图像:R2分别为0.223、0.278、0.327、0.285、0.309、0.329、0.325、0.346、0.360、0.390、0.380)。以上各种前置和后置迭代等级组合所得图像主观评价均可满足诊断要求(评分≥3)。结论当NI=8时,骨算法最佳前置和后置迭代等级组合为80%和100%;标准算法最佳迭代等级组合为100%和100%。鼻窦CT扫描中,选择恰当的前置和后置迭代等级组合,能够在图像质量满足诊断要求的前提下,有效降低辐射剂量。
简介:胸痛三联征在临床上有相似的胸痛症状,误诊率居高,其确切病因尚不十分明确。针对经典支持向量机不适用于胸痛三联征此类非平衡数据集分类的缺点,本研究结合径向基核函数、布谷鸟算法以及支持向量机,提出一种基于布谷鸟算法优化支持向量机的分类识别模型,用于胸痛三联征的分类诊断。在收集到的735例有效样本数据集上,采用Java程序抽取平衡数据集。实验结果显示,基于平衡数据集,该模型的平均正确率为80.667%;基于非平衡数据集,其平均正确率为97.767%,相比经典支持向量机、粒子群算法-支持向量机、遗传算法-支持向量机均有不同程度的提高。因此,本研究模型对胸痛三联征的分类诊断具有一定的参考价值。
简介:摘要目的对结直肠癌同时性腹膜转移患者进行精准诊断和分期依旧困难。本研究旨在利用人工智能的ResNet-3D算法构建一种矢量向量模型(SVM)分类器,来预测结直肠癌同时性腹膜转移。方法由放射科医生按原始格式,回顾性提取2017年1月至2018年5月期间,在中山大学附属第六医院经病理确诊的同时性腹膜转移或无腹膜转移的结直肠癌患者术前增强CT图像;从专业随访人员维护的结直肠癌数据库中,收集相应患者的临床病理参数和生存期资料。排除术后异时性腹膜转移、或肿瘤复发的患者以及无法获得增强CT扫描原始图像者。应用ITK-SNAP软件在结直肠癌同时性腹膜转移患者的术前增强CT扫描图像中勾画原发肿瘤,提取肿瘤邻近腹膜的特征,建立一种ResNet-3D+SVM分类器。再利用测试集对ResNet-3D+SVM分类器的效能进行评估,并与放射科医生常规CT的诊断水平进行对比。结果同时性结直肠癌腹膜转移患者74例和同期无腹膜转移的96例患者共计170例入组,被随机分为训练组(腹膜转移54例,非腹膜转移76例)和测试组(腹膜转移和非腹膜转移各20例)。通过深度学习构建的ResNet-3D算法只用了34 s就分析完了所有40例测试组患者的7 837张测试图像。为了提高该模型对腹膜转移的诊断准确性,将ResNet-3D的人工智能(AI)模型与12个腹膜腹膜转移特征相结合,构建了SVM分类器(均P<0.05)。该分类器的腹膜转移诊断准确率为94.11%,曲线下面积(AUC)为0.922(0.912~0.944),灵敏度为93.75%,特异度为94.44%,阳性预测值为93.75%,阴性预测值为94.44%。其诊断能力明显优于常规增强CT(AUC:0.791)。结论基于深度学习算法构建的ResNet-3D+SVM分类器,在诊断结直肠癌同时性腹膜转移中显示出很大的潜能。
简介:摘要目的探索使用级联模型在CT平扫图像中自动检出肾结石的可行性。方法回顾性搜集2018年1月至7月在北京大学第一医院行泌尿系CT平扫并诊断为肾结石的59例患者的临床和影像资料。根据患者CT检查时间将患者图像分为两组:肾脏分割模型训练集(30例)和肾结石检出模型测试集(29例)。建模包括:(1)训练肾脏分割的深度学习模型,采用U-Net神经网络,以dice系数评估肾脏分割算法的性能;(2)在肾脏分割的基础上,用阈值算法和区域生长算法检出所得肾脏区域里的结石;(3)测量肾结石各向径线值(长径、中径和短径)和CT值,并将结果返回到结构化报告。由1名医师记录肾结石位置并手动测量肾结石各向径线值(长径、中径和短径)和CT值作为金标准,计算模型自动检出结石的灵敏度、特异度和准确度,并使用Bland-Altman法分析模型自动测量和医师手工测量结果的一致性。结果测试集29例患者,共11 358层CT图像,58个肾脏纳入研究,其中38个肾脏有结石,共有56个结石,20个肾脏无结石。使用U-Net模型对测试集11 358层CT图像进行分割,平均dice系数为0.96;其中10 945(96.36%)层图像分割效果很好,dice系数≥0.90。以肾脏为单位,模型在测试集中检出结石的灵敏度、准确度、特异度分别为100%(38/38)、100%(38/38)、100%(20/20);以结石为单位,模型检出结石的灵敏度、准确度分别为100%(56/56)、96.6%(56/58)。结论肾结石检出级联算法可以在CT平扫图像中自动检出肾结石,并自动返回到结构化报告中,提高临床工作效率。
简介:摘要目的建立基于贝叶斯概率估计算法的多维度周边快速对比敏感度函数(pqCSF)检测方法,并评估此检测方法的可行性和准确性。方法采用横断面研究设计,2017年9月至2018年3月于中山大学中山眼科中心非连续纳入12名健康正视眼受试者19眼,平均年龄(22.92±2.91)岁,平均球镜度和柱镜度分别为(-0.34±0.52)D和(-0.30±0.42)D,裸眼视力均≥1.0。基于贝叶斯概率估计算法,通过对比敏感度峰值γmax、空间频率峰值ƒmax、带宽β和低对比度截距δ来快速描绘全空间频率的对比敏感度函数(CSF)曲线,建立了(pqCSF)检测方法。所有受试者均在上方、下方、颞侧和鼻侧4个方向6°、12°、18°和24°离心率的16个周边视野位置(其中周边18°的颞侧视野接近生理盲点,不纳入研究)进行pqCSF检测。比较各个视野位置的CSF曲线下面积(AULCSF)以及19个空间频率(以对数单位等间隔分布)所对应的对比敏感度。结果各方向内随着离心率不断增加,AULCSF逐渐降低,不同离心率间AULCSF两两比较,差异均有统计学差异(均P<0.05)。周边6°、12°和24°水平方向(鼻侧+颞侧)AULCSF均较垂直方向(上方+下方)AULCSF大,差异均有统计学意义(均P<0.05)。CSF曲线显示,随着与中心凹距离的增加,pqCSF、AULCSF及高频截止频率都有不同程度的降低,并且数据标准差也逐渐增大。结论pqCSF检测可以描绘出周边大范围视野较完善的周边CSF曲线图,较好地反映周边视功能质量。
简介:摘要目的探索基质辅助激光解吸电离飞行时间(MALDI-TOF)质谱仪不同算法快速识别甲氧西林耐药金黄色葡萄球菌可行性。方法从北京同仁医院检验科2017年1月至2019年6月的细菌库中选取314株金黄色葡萄球菌临床分离株用MALDI-TOF MS鉴定,经头孢西丁纸片法(抑菌环直径≤21 mm)及聚合酶链反应(PCR)mecA基因初筛,将菌株分为甲氧西林耐药的金黄色葡萄球菌(MRSA)组(130株)和甲氧西林敏感的金黄色葡萄球菌(MSSA)组(184株);甲酸提取法采集谱图,将MRSA组和MSSA组再各分成3个亚组,即MRSA-1亚组(43株)、MRSA-2亚组(42株)及MRSA-3亚组(45株)和MSSA-1亚组(60株)、MSSA-2亚组(61株)及MSSA-3亚组(63株);使用Bruker MALDI-TOF质谱仪的ClinProTools软件中的遗传算法、快速分类算法、监督式神经网络算法以及中元汇吉质谱仪EX-Smartspec软件的卷积神经网络算法进行试验研究,重复3轮(第1轮MRSA-1和MRSA-2、MSSA-1和 MSSA-2为建模组,MRSA-3和MSSA-3为验证组,依此类推进行3轮)。以4种算法的受试者工作特征(ROC)曲线下面积展开性能确认。从北京同仁医院检验科2019年7—12月的细菌库中选38株MRSA和40株MSSA临床株,使用甲酸提取法采集谱图,对卷积神经网络算法建立的模型进行独立测试。结果在3轮建模和验证后,3个子组Bruker ClinProTools遗传算法的ROC曲线下面积分别为0.89、0.74和0.64,快速分类算法的ROC曲线下面积分别为0.77、0.95和0.94,监督式神经网络算法的ROC曲线下面积分别为0.90、0.98和0.98,中元汇吉质谱仪EX-Smartspec软件的卷积神经网络算法的ROC曲线下面积分别为0.95、0.99和0.99。卷积神经网络算法的独立测试结果显示其敏感度88.82%(810/912)、特异度81.15%(779/960)、准确性84.88%(1 589/1 872)、ROC曲线下面积0.92。结论Bruker ClinProTools软件中的监督式神经网络算法与中元汇吉质谱仪EX-Smartspec软件所用的卷积神经网络算法在快速识别MRSA时的性能指标可被临床接受。利用卷积神经网络算法,通过MALDI-TOF质谱技术可快速确认MRSA株,及时指导临床用药。
简介:目的探讨能谱CT金属伪影消除(MARs)技术与普通CT骨算法重建在消减脊柱内固定术后伪影的价值.方法回顾性分析2013年2月—2014年2月解放军第一一七医院22例行脊柱金属内固定置入患者的影像学资料.其中男14例、女8例,年龄30~77岁.22例患者术后不同时间分别行能谱CTMARs技术检查(MARs组)、骨算法成像检查(骨算法组).测量并计算各组感兴趣区的伪影指数(AI),采用骨窗图像质量主观评估标准对骨窗图像质量进行评分,比较MARs组和骨算法组患者骨窗图像质量评分情况,以及不同单能量值MARs组和骨算法组间AI的分布差异.结果MARs组中,随着单能量值的减低,AI值逐渐增高.MARs组各单能量值和骨算法组间比较,AI值差异有统计学意义(F=8.696,P〈0.05);进一步组间LSD-t检验显示,在60~140keV条件下,MARs组AI值均小于骨算法组,差异均有统计学意义(P值均〈0.05).骨窗图像质量评分比较,骨算法组(2.81&#177;0.39)分,优于MARs组(2.00&#177;0.53)分,差异有统计学意义(t=4.856,P〈0.01).结论能谱CTMARs技术和骨算法成像对消减脊柱金属内固定伪影各有优点,应当结合临床需要选择合适的CT成像技术.
简介:摘要目的探讨深度学习图像重建(DLIR)算法优化儿童多发性大动脉炎增强CT(CECT)图像质量和提升血管壁测量精度的价值。方法回顾性收集2019年9月至2020年4月于首都医科大学附属北京儿童医院32例进行低辐射剂量体部CECT的多发性大动脉炎患儿,扫描管电压100 kVp,将原始数据采用滤波反投影(FBP)、50%自适应统计迭代重建(ASIR-V)、100%ASIR-V、DLIR重建为0.625 mm的薄层图像。主观评价由两名医师采用5分法评估整体图像噪声、血管壁的显示能力以及诊断信心指数。客观评价测量各组图像血管壁厚度,计算测量标准差和变异系数(CV),同时计算对比噪声比。使用Friedman检验比较4组图像间主观评分的差异,采用随机区组的方差分析比较客观测量指标的差异。结果整体噪声方面100%ASIR-V、DLIR间评分差异无统计学意义(P>0.05),此两组图像评分均高于FBP、50%ASIR-V(P均<0.05),血管壁显示能力与诊断信心指数DLIR优于其他图像(P均<0.05)。客观测量结果显示,DLIR图像管壁厚度标准差和CV小于其他图像,差异有统计学意义(P均<0.05),100%ASIR-V与DLIR间血管噪声值、肌肉噪声值、对比噪声比的差异无统计学意义(P均>0.05),均低于FBP和50%ASIR-V图像(P均<0.05)。与50%ASIR-V图像相比,DLIR图像的CV降低了22.9%,对比噪声比提升了46.8%。结论DLIR可改善大动脉炎患儿的CECT图像质量,提升血管壁的测量精度,使进一步降低辐射剂量成为可能。
简介:摘要目的通过与多模型迭代重建算法(ASiR-V)对比,探讨深度学习图像重建(DLIR)算法在低辐射剂量下对乏血供肝转移瘤CT图像质量及检出效能的影响。方法前瞻性收集2021年1月至4月郑州大学第一附属医院因乏血供肝转移病变需行全腹部增强CT的56例患者,增强后第1静脉期均行常规辐射剂量(400 mA)CT扫描,根据第2静脉期管电流的不同将患者分为A(280 mA,19例)、B(200 mA,19例)、C(120 mA,18例)组。各组第1静脉期和第2静脉期图像均进行权重为60%的ASiR-V(ASiR-V60%)和高强度的DLIR(DLIR-H)重建。图像质量客观评价指标包括噪声、肝脏的信噪比(SNR肝脏)和门静脉的信噪比(SNR门静脉)、病灶的对比噪声比(CNR病灶),主观评价指标包括总体图像质量评分、病灶显示能力评分、诊断信心度评分,并记录各组有效辐射剂量(ED)和病灶检出率。采用配对t检验比较ASiR-V60%和DLIR-H图像间客观指标的差异,采用配对资料的Wilcoxon符号秩和检验比较主观评价指标。结果第2静脉期A、B、C组ED分别为(5.56±0.35)、(3.88±0.23)、(2.42±0.23)mSv。A、B、C组第2静脉期的ED分别比第1静脉期的ED降低30%、50%、70%。随着辐射剂量的降低,噪声逐渐增加,CNR病灶、SNR肝脏、SNR门静脉逐渐降低。在相同辐射剂量条件下,DLIR-H的图像的客观评价指标均优于ASiR-V60%,差异有统计学意义(P均<0.001)。各组的主观评分随辐射剂量的降低而降低,在相同辐射剂量条件下,DLIR-H的总体图像质量、病灶显示能力和诊断信心评分均高于ASiR-V60%(P均<0.001)。A组的ASiR-V60%和DLIR-H均将全部病灶检出,检出率为100%(84/84),B组检出率均为92.0%(75/81),C组检出率均为88.0%(79/89)。结论与ASiR-V60%相比,DLIR-H在低辐射剂量下均可提高总体图像质量及乏血供肝转移病灶的显示能力,增加诊断信心。
简介:摘要目的通过生物信息学及机器学算法筛选及分析前列腺癌的关键表达基因,探究诊断前列腺癌的生物标志物及与前列腺癌免疫细胞浸润的相关性。方法使用生物信息学方法从基因表达谱(GEO)数据库中下载3个前列腺癌组织信使RNA(mRNA)芯片数据集:其中GSE46602和GSE69334作为训练集,GSE32571作为验证集。对数据集GSE46602及数据集GSE69223两个数据集进行合并分析后获得差异表达基因(DEGs),京都基因与基因组百科全书(KEGG)、基因本体论(GO)、疾病富集分析(DO)与基因富集分析(GSEA)用于功能富集分析。Lasso回归筛选特征基因11个,支持向量机(SVM)筛选特征基因2个,取交集为两个特征基因丝氨酸蛋白酶(HPN)、角蛋白23(KRT23),将两个基因在数据集GSE32571中进行验证,同时通过实时荧光定量聚合酶链反应在前列腺癌相关细胞系中进行验证,最后进一步分析了两个特征基因与免疫细胞浸润相关联系,两组间使用Student’s t检验评估统计学意义。结果通过对GEO数据库3个前列腺癌数据集使用R语言及机器学习等方法进行分析,总共发现35个DEGs和两个核心基因,其中20个为下调基因,15个为上调基因。通过GO、KEGG、DO及GSEA通路分析发现这些基因富集在表皮细胞分化、角质形成等功能中,以细胞外基质受体相互作用及雌激素受体通路等信号上。通过套索算法(LASSO)及SVM筛选出的特征基因与数据集GSE32571进行检验,发现HPN、KRT23是前列腺癌的2个诊断生物标志物,在前列腺腺癌细胞系中mRNA水平进行验证符合生物信息分析结果,HPN在Du145、PC3、Vcap、Lncap、C4-2、22RV1组相对表达量(1.10±0.29、0.46±0.12、3.02±0.79、1.58±0.09,0.39±0.02,0.41±0.07)指标高于RWPE1组(0.09±0.01),差异有统计学意义(t=6.000、5.030、6.400、27.980、15.600、6.870,P<0.05),KRT23在Du145、PC3、Vcap、Lncap、C4-2、22RV1组相对表达量(0.42±0.01、0.15±0.03、0.15±0.02、0.15±0.03、0.62±0.09、0.04±0.01)指标低于RWPE1组(1.01±0.19),差异有统计学意义(t=5.210、7.600、7.620、7.580、3.120、8.630,P<0.05),且HPN、KRT23与免疫细胞相关,HPN与T细胞CD8、静息肥大细胞、静息树突状细胞呈负相关,与巨噬细胞M0呈正相关;KRT23与巨噬细胞M0呈负相关,与静息树突状细胞、静息肥大细胞呈正相关。结论HPN、KRT23可以作为前列腺癌的诊断性生物标志物,且HPN、KRT23与滤泡辅助性T细胞及调节性T细胞等免疫细胞相关。