简介:摘要目的通过对济南市某出租车公司司机进行健康体检,旨在了解出租车司机的健康状况及相关影响因素。方法分析246名出租车司机及215名企业职工的体检数据,将检出疾病及阳性体征进行汇总分析。结果出租车司机体检结果中,检出率较高的疾病依次为超重/肥胖(60.6%)、高血压(43.9%)、脂肪肝(42.3%)、血脂异常(30.5%)、肝功能异常(24.4%)、空腹血糖受损(18.7%)、高血糖(16.3%),出租车司机检出率较高的慢性疾病与对照组比较,差异有统计学意义(P<0.05)。结论济南市出租车司机常见的慢性疾病发病率高于普通人群,应加强对出租车司机的健康教育与健康管理,减少、控制慢性疾病的发生和发展,提高出租车司机的健康水平。
简介:目的建立一种预处理方法,在进行医疗费用数据挖掘时,将因变量(呈偏态分布的连续性变量)转换为分类变量,从而得到更加科学合理的研究结果。方法以广东省甲型病毒性肝炎医疗费用调查取得的115例患者为研究对象,分别采用中位数的分类方法和K-means聚类的方法作为预处理方法,对医疗费用这一呈偏态分布的因变量进行分类,然后建立支持向量机数学模型,采用支持向量机进行医疗费用影响因素分析;通过比较模型的预测精度、模型收益以及影响因素的筛选结果,确定最优的预处理方法。结果115例甲肝病人甲肝总住院费用中位数为2744.69元,呈偏态分布。应变量以中位数方法分类,采用支持向量机模型筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、性别、疾病类型);采用聚类分析进行数据预处理时筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、住院天数、支付方式)。与中位数方法的分类方法比较,采用聚类分析进行数据预处理时,支持向量机模型结果得到的预测精度由91.30%上升到97.39%;收益图表陡峭地升高到100.00%然后渐渐变得平缓,显示模型收益更好;影响因素筛选结果更加科学合理,符合实际情况。结论聚类分析是一种优秀的数据挖掘预处理方法,具有良好的应用性。