学科分类
/ 1
1 个结果
  • 作者: 庞海玉 朱兰 徐涛 刘青 李兆艾 龚健 王玉玲 汪俊涛 夏志军 郎景和
  • 学科: 医药卫生 >
  • 创建时间:2021-09-05
  • 出处:《中华妇产科杂志》 2021年第08期
  • 机构:中国医学科学院北京协和医学院北京协和医院医学科学研究中心 疑难重症及罕见病国家重点实验室 100730,中国医学科学院北京协和医学院北京协和医院妇产科 国家妇产疾病临床研究中心 100730,中国医学科学院基础医学研究所北京协和医学院基础学院流行病及统计学系 100005,甘肃省妇幼保健院妇产科,兰州 730050,山西省儿童医院 山西省妇幼保健院妇产科,太原 030013,南京医科大学附属无锡妇幼保健院妇产科 214001,广东省佛山市妇幼保健院妇产科 528000,贵阳市妇幼保健院妇产科 550001,中国医科大学附属盛京医院妇产科,沈阳 110004
  • 简介:摘要目的应用机器学习中的随机森林算法探讨中国女性尿失禁(UI)发病的危险因素,并评价各危险因素对于UI发病的预测效果。方法采用多阶段分层整群抽样,在全国调查55 477例成年女性UI情况;基线调查于2014年2月至2016年1月完成,2018年6月至12月电话随访;最终纳入基线无UI且随访UI诊断指标数据完整的对象。采用欠采样技术,按照1∶1的比例从随访时未发生UI的人群中随机抽取与随访对新发UI相等人数作为对照,将这些调查对象的研究数据按照7∶3的比例随机分成训练集和测试集。将单因素分析中P<0.2的候选变量,带入训练集并采用随机森林算法建模,在训练集筛选UI发病的危险因素,根据重要性对危险因素排序,并在测试集中验证。结果共30 658例(55.26%,30 658/55 477)完成随访,中位随访时间3.7年。纳入本研究的24 985例基线无UI的对象中,随访调查UI发病人数为1 757例(7.03%,1 757/24 985),其中压力性UI 1 117例(4.47%,1 117/24 985),急迫性UI 243例(0.97%,243/24 985),混合性UI 397例(1.59%,397/24 985)。随机森林模型固定特征数量为2个、决策树数量为300棵时,平均袋外估计误差率最低,此时模型分类准确率为64.3%,敏感度为64.2%,特异度为64.4%。根据Gini系数平均下降量,得到预测UI发病的前10位影响因素依次为:年龄、分娩次数、分娩方式、体质指数(BMI)、绝经状态、糖尿病史、教育程度、盆腔手术史、城乡分布、婚姻状况。结论应用机器学习中的随机森林算法,从复杂的多因素中识别出预测中国女性UI发病的前10位影响因素,依次为:年龄、分娩次数、分娩方式、BMI、绝经状态、糖尿病史、教育程度、盆腔手术史、城乡分布、婚姻状况。

  • 标签: 尿失禁 危险因素 随机分配 算法 机器学习 纵向研究 随机森林