简介:摘要目的加强医疗数据资源整合共享,为临床科研人员提供高质量、可利用的数据,推进医疗数据在临床科研中的深入应用。方法根据全院级医疗大数据平台的建设和应用目标,将多个主要临床业务信息系统的数据整合后进行数据清洗、加工和解析,最终汇聚到统一平台中,形成有价值、可被利用的数据资源。结果构建面向临床科研的全院级医疗大数据平台,该平台累积了北京大学人民医院自2004年以来,1 342万余名患者的5 000万余次就诊数据,设计了面向分析的医院科研通用数据模型,并能够按照模型在平台上进行科研数据查询与导出,建立了医院临床科研数据管理规范和服务机制。结论医疗大数据平台的建设及数据治理实践为北京大学人民医院基于医疗大数据的高水平科技攻关提供了高质量数据基础,进一步提升了临床科研效率和质量。同时,在确保数据安全、合规利用的基础上,从全院视角对临床科研数据进行了管控。
简介:摘要目的探讨监测、流行病学和最终结果(SEER)数据库中接受放疗的不可手术Ⅲ期非小细胞肺癌(NSCLC)患者数据,评估年龄对预后的意义。方法收集SEER数据库中2010年至2016年经过美国癌症联合会(AJCC)第7版分期标准诊断为ⅢA和ⅢB期未接受手术治疗、接受放疗的NSCLC患者资料,共17 117例纳入分析。根据最大选择检验确定年龄的最佳分界值为72岁,据此将患者分为年轻组(<72岁)(11 008例)和年老组(≥72岁)(6 109例)。比较两组的临床基本特征,采用Kaplan-Meier法进行总生存(OS)分析,并行log-rank检验。采用多因素Cox比例风险回归模型分析OS影响因素。采用累积发生函数(CIF)估算两组患者肺癌特异死亡率和其他原因死亡率,应用Fine-Gray竞争风险模型评价两组间死亡率差异,并对肺癌特异死亡影响因素进行分析。结果年老组患者中鳞状细胞癌比例高于年轻组[51.1%(3 123/6 109)比46.8%(5 154/11 008),P<0.01],ⅢA期比例亦高于年轻组[67.4%(4 120/6 109)比60.1%(6 615/11 008),P<0.01];年老组接受化疗患者比例低于年轻组[69.2%(4 226/6 109)比88.6%(9 748/11 008),P<0.01]。年轻组患者的2年和5年OS率分别为39.2%和18.0%,年老组分别为32.4%和12.5%,两组OS差异有统计学意义(P<0.01)。多因素Cox回归分析显示,年龄、性别、人种、诊断年份、病理类型、T分期、N分期、未手术原因、化疗均为患者放疗后OS的独立影响因素(均P<0.05),其中年龄(≥72岁比<72岁)的HR=1.13(95% CI 1.09~1.18)(P<0.01)。年老组2年和5年的肺癌特异死亡累积发生率分别为60.3%和75.7%,高于年轻组的55.9%和74.0%,两组肺癌特异死亡累积发生率差异有统计学意义(P<0.01);年老组2年和5年的其他原因死亡累积发生率分别为7.3%和11.8%,高于年轻组的4.9%和8.0%,两组其他原因死亡差异有统计学意义(P<0.01)。根据竞争风险模型分析显示,年龄、性别、人种、诊断年份、病理类型、T分期、N分期、是否化疗均为影响不可手术Ⅲ期NSCLC患者接受放疗后肺癌特异死亡的独立影响因素,其中年龄(≥72岁比<72岁)的HR=1.07(95% CI 1.02~1.12)(P=0.002)。结论年龄是不可手术Ⅲ期接受放疗的NSCLC患者独立预后影响因素。年老患者预后差,其肺癌特异死亡和其他原因死亡的风险均升高。
简介:摘要目的基于在线数据库分析阐明E2F转录因子家族成员mRNA在胰腺癌组织中的表达水平及其在胰腺癌患者中的预后意义。方法利用基因表达谱交互式分析(GEPIA)在线分析数据库,采用Mann-Whitney U检验及Kaplan-Meier生存分析的统计学方法分别分析E2F转录因子家族成员mRNA在179例胰腺癌与171例癌旁组织的差异性表达,分析其每百万转录本(TPM)表达差异,并分析E2F转录因子家族成员mRNA表达与胰腺癌病理分期之间的关系。基于Kaplan-Meier Plotter数据库分析E2F转录因子家族成员mRNA表达水平与胰腺癌患者预后的关系,及其在胰腺癌患者亚组中的预后价值。采用Mann-Whitney U检验比较胰腺癌与癌旁组织E2F转录因子家族成员的表达水平;并采用Log-rank检验及Kaplan-Meier法对数据库中的纳入患者进行预后分析。结果GEPIA数据库分析结果表明,胰腺癌组织中E2F转录因子家族成员mRNA表达均高于癌旁组织。其中,胰腺癌组织中E2F1、E2F3和E2F8 mRNA表达水平均显著高于癌旁组织,差异有统计学意义(P<0.01)。此外,TPM表达分析结果也提示胰腺癌组织中较高的E2F1、E2F3和E2F8 TPM水平,差异有统计学意义(P<0.05)。GEPIA数据库分析结果还提示E2F2、E2F3、E2F6以及E2F8 mRNA表达与胰腺癌患者肿瘤病理分期显著相关,差异有统计学意义(P<0.05)。Kaplan-Meier Plotter在线数据库分析结果提示,高表达的E2F1、E2F2、E2F3、E2F7以及E2F8 mRNA与胰腺癌患者较低的总体生存率显著相关(P<0.05),而高表达的E2F6则与胰腺癌患者较好的总体生存率显著相关(P<0.05)。此外,高表达的E2F1、E2F2、E2F3、E2F7以及E2F8 mRNA与胰腺癌患者较差的无复发生存率显著相关(P<0.05),而E2F4高表达则与胰腺癌患者无复发生存率较好显著相关(P<0.05)。亚组分析结果则表明E2F1、E2F2、E2F3、E2F7及E2F8在不同肿瘤阶段、不同性别以及不同突变负荷的胰腺癌患者中均具有一定的预后价值。结论E2F转录因子家族成员在胰腺癌中高表达且与胰腺癌患者预后较差显著相关,尤其在早期胰腺癌中,提示其可能成为早期胰腺癌预后预测及治疗的新靶点。
简介:摘要脑卒中发病具有致残率高、死亡率高的特点,给社会和个人带来巨大的疾病负担。在全球卫生系统高度信息化的今天,各国纷纷搭建与完善公共卫生信息平台,通过平台中的公共卫生信息实现收集、整理、挖掘、分析、共享一体化,研究脑卒中的疾病负担,为卫生决策提供支撑。本研究通过对国内外文献资料进行检索复习,概述了我国脑卒中疾病负担的研究方法及其公共卫生信息来源,评价了各个疾病负担研究方法的公共卫生学意义以及局限性,描述了全球以及我国脑卒中疾病负担大数据平台的应用及发展情况,并通过总结我国现有的脑卒中疾病负担评价系统的局限性,对我国建立更加现代化以及信息化的脑卒中疾病负担评价系统提供建议。
简介:摘要目的评估非特异性检验指标组成的预测模型在胃癌早期诊断中的可行性。方法从上海长海医院的电子病案系统数据库中,共纳入2010年1月1日至2019年4月30日的24 615例病例记录,包括10 497例胃癌,5 198例胃癌前疾病, 和8 920名健康体检。通过分层随机抽样,将研究人群分为验证集、训练集和测试集。对所有实验室变量进行数据处理和质量控制后,通过梯度增强决策树、随机森林、支持向量机和人工神经元网络这4种机器学习算法,选择随机森林作为最优机器学习算法和诊断效能分组,使用后向逐步回归法训练数据,构建最佳特征模型采用受试者工作特征(ROC)曲线评价模型的诊断效能。结果本研究建立了由22个常规检验项目组成的诊断模型V22, 诊断早期胃癌的ROC曲线下面积(AUC)为0.808,敏感度为85.7%;特异度为91.9%。对癌胚抗原(CEA)阴性胃癌,V22也显示出较高的诊断准确率0.813,AUC为0.801。结论V22是一个有临床应用价值的胃癌辅助诊断模型,可以很好的区分早期胃癌和由健康组和癌前疾病组成的对照组,对早期胃癌的检出率优于传统的肿瘤标志物CEA。
简介:摘要肝病与肝癌是威胁我国人民生命健康的常见疾病,大数据和人工智能已成为提高临床诊断与治疗水平和服务能力的重要支撑。然而,大数据的发展应用尚不成熟,主要存在以下问题:(1)海量健康医疗数据种类繁多,来源各异,但较为分散,缺乏一体化数据存储与分析平台。(2)不同医疗中心之间数据标准不同,数据概念亦存在较大差异,以及个人表达习惯等问题,均导致数据难以处理,无法充分融合。因此,大规模健康医疗数据并不等同于健康医疗大数据。笔者团队结合东南肝胆健康大数据研究所在肝病与肝癌领域大数据平台建设方面的实践经验,提出肝病与肝癌大数据平台建设标准化体系,包括大数据联盟统筹建设大数据平台、完善的大数据标准体系、标准化数据治理流程及结合循证医学与新兴技术的大数据应用。该体系可为健康医疗大数据产业高质量发展提供全新模型,并可推广复制到其他专病领域,为建设健康中国贡献力量。
简介:摘要:工业时代以来,食品工业流水线为大量仍在温饱线挣扎的人们带来了廉价且安全的食品,以社会生产力的进步很大程度上缓解了全球饥饿问题,同时也推动了食品产业标准规范的建立实施,客观而言,食品行业的进步发展会为人类带来巨大福利。然而,伴随着食品行业技术进步不断加快,食品安全问题也在数字媒体的关注曝光下频繁进入人们的视野中,近年来,无论是“毒奶粉”“瘦肉精”还是“澳洲牛肉”等,一次一次刺激着人们的感官,刷新着人们对现代食品安全的认知。因此,为就当下时代背景下的食品安全风险管理问题进行解决,本文主要对大数据技术引进食品风险管理问题进行讨论,旨在分析得到其技术实施价值,发现问题,提出部分改善对策,以其大数据背景下食品风险管理能进一步得到合理使用。
简介:摘要大数据多中心临床研究是获得多模态和完整临床关键诊疗数据的有效途径。然而由于儿科人群的特殊性,儿科临床研究的开展备受制约,我国儿科医疗资源的相对匮乏及分布不均也使开展多中心临床研究困难重重,难以形成适合我国儿童各类疾病的诊治指南。大数据时代的到来以及大数据挖掘和分析、算法新技术的应用必将成为推动临床研究发展的强劲动力,同时为儿童疾病多中心研究的开展提供有力手段及创新思路。
简介:摘要近十余年来,智能神经外科已逐步进入轨道化、系统化、规模化的发展阶段,大数据挖掘、机器学习/深度学习/神经网络、临床决策支持系统/专家系统、手术导航与机器人等多个研发版块已初步发展成熟,相关应用已覆盖神经外科各类疾病的临床诊断、治疗决策、手术辅助、预后评估、模拟教学等多种场景,但整体尚处于起步阶段。在中国脑计划的开局之年,全面、理性、客观地回顾智能神经外科的发展历程,审视相关成果的应用现状及风险,具有承前启后的时代意义。
简介:摘要近十余年来,智能神经外科已逐步进入轨道化、系统化、规模化的发展阶段,大数据挖掘、机器学习/深度学习/神经网络、临床决策支持系统/专家系统、手术导航与机器人等多个研发版块已初步发展成熟,相关应用已覆盖神经外科各类疾病的临床诊断、治疗决策、手术辅助、预后评估、模拟教学等多种场景,但整体尚处于起步阶段。在中国脑计划的开局之年,全面、理性、客观地回顾智能神经外科的发展历程,审视相关成果的应用现状及风险,具有承前启后的时代意义。