学科分类
/ 24
470 个结果
  • 简介:本文作者从实际应用出发,对现存数据挖掘决策树分类方法进行了研究,并应用到系统当中,实现了决策支持模块。关键词数掘挖掘;决策树算法;改进;实现中图分类号TP301.6文献标识码A文章编号1007-9599(2010)04-0000-02DataMiningDecisionTreeImprovement&ImplementationXiaYan,ZhouXiaohong,WangDong(ChangchunTechnologyCollege,Changchun130033,China)AbstractTheauthorstudiedonexistingDataMiningdecisiontreeclassificationmethodbasedonthepracticalapplication,andappliedtothesystem,achievedadecisionsupportmodule.KeywordsDataMining;Decisiontreealgorithm;Improve;Achieve随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将会产生重要的作用。因此,数据挖掘涉及的学科领域逐渐扩大,数据挖掘的方法也在不断地改进和提高。分类在数据挖掘中是一项非常重要的任务,分类算法可以分为决策树分类算法、遗传算法、神经网络方法、K-最近邻分类算法等。这里,以疾病防控儿童免疫管理系统中决策支持子系统的开发过程为例,对决策树分类算法的改进及在实际中的应用进行阐述。一、数据选取和数据预处理在本系统中,以预防接种中遇到异常反应后记录的“异常反应调查表”中的数据为例进行说明。具体实现过程详细说明首先输入训练集,由于在真实的SQLServer数据库当中,为了降低存储要求和减少存储时间,并非真正存储每个数据项的属性值,而是用存储数字来对应相应的意义,如在数据库的数据表中,“性别”字段中“1”代表“男”、“2”代表“女”,反应到程序页面时再映射回原来的值,为了说理清晰又限于篇幅,这里只将所有数据集中有代表性的十几组数据作为分类模型创建的输入训练集。表1判断是否需要计划外加强免疫的属性表儿童编号月龄出生状态常住地上次注射后反应是否需要计划外加强免疫0405102<=2正常产城市无不良反应否0405495<=2正常产农村无不良反应否0401342>5正常产城市无不良反应是04054352…5正常产城市轻度反应是04065342…5非正常产城市重度反应是04072342…5非正常产农村重度反应否0401544>5非正常产农村重度反应是0408519<=2正常产城市轻度反应否0404566<=2非正常产城市重度反应是04035472…5非正常产城市轻度反应是0401534<=2非正常产农村轻度反应是0405856>5正常产农村轻度反应是0409533>5非正常产城市无不良反应是04053442…5正常产农村轻度反应否二、生成决策树对训练集的每一个属性,计算其信息增益。以“月龄”属性为例,每个结点中的正反例的个数分别为[2,3]、3,2、4,0,分别计算如下info2,3==0.971;info3,2==0.971;info4,0=0;计算信息熵E(月龄)==0.693;计算该属性的信息增益量,选取信息增益最大的属性为节点,按该属性的值划分数据集合Gain(月龄)=Info(9,5)-E(月龄)=0.940-0.693=0.247;同理,对“注射反应”属性、“出生状态”属性、“常住地”属性都可计算每个结点的正反例的个数(由于篇幅有限,不作计算)。通过对各属性信息增益的计算结果,选择“月龄”属性作为根节点,然后划分“月龄<=2”的所有可能性。计算当“月龄<=2”时,“注射反应”、“出生状态”、“常住地”的信息增益值Gain(注射反应)=Info(2,3)-E(注射反应)=0.971-0.4=0.571;Gain(出生状态)=Info(2,3)-E(出生状态)=0.971-0=0.971;Gain(常住地)=Info(2,3)-E(常住地)=0.972-0.951=0.020;同理考虑“月龄>5”的情况,由于“月龄>5”时,各个节点都是纯节点,所以不再划分。三、产生决策规则遍历决策树,输出叶结点类属性值,用IF—THEN形式表达为IF(月龄2…5AND注射反应=无)THEN(类别=是)IF(月龄2…5AND注射反应=轻)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=正常产)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=城市)THEN(类别=否)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=农村)THEN(类别=是)……依此类推,共可产生十三条规则。四、决策支持子系统的分析用上述基于决策树的分类算法所得到的模型生成的规则来预测测试集中的未知数据属于哪一类,并通过该模型的测试结果与实际情况相吻合的准确率来判断该决策树是否有效。首先,用整个数据集中2/3的数据作为训练集按照基于决策树的分类算法来建立模型,生成一棵决策树。然后,用余下的1/3的数据作为测试集,通过创建的模型进行预测,并将预测结果和实际值进行比较。如果准确率达到或超过事先确定的阈值,则可以认定该模型对于数据分类是有效的,能够在实际中应用;反之,则认定该模型的分类效果不好,需要按以上步骤来重新判断,直到分类准确率达到预定的阈值为止。在本系统中,经过测试预测准确率已达到87%,在可以接受的范围内,所以算法是有效、可行的。参考文献1陈文伟,黄金才.数据仓库数据挖掘.人民邮电出版社,20042王万森.人工智能原理及应用.电子工业出版社,20003范明,孟小峰.数据挖掘——概念技术.机械工业出版社,2001作者简介夏琰(1980-),女,吉林长春人。长春职业技术学院信息技术分院,教师,讲师,硕士,研究方向为计算机应用。

  • 标签:
  • 简介:再也没有什么比盘点过去和展望未来更让人兴奋和彷徨的了。技术的更新飞一般的快速,常常是一项技术还没有应用得透,下一项新的技术就涌了过来,每日都在软件的不断更新中度过。但从另一方面来讲,这恰好说明了软件世界的创造,正是软件制作者的激情梦想才造就了今日软件业的繁华。下面罗列几个2005年和微软相关的技术产品,来证实一下上述的观点。

  • 标签: 技术 产品 微软 软件业 创造力 制作者
  • 简介:以用户为中心”的号角吹响已有好几年。在这几年中,“‘用户体验”的思想、概念、细节和理想谈得较多,真正将其实现流程化“引导”的很少。但目前,它已经慢慢显现出从概念向实用操作转变的趋势。尽管对于如何进行“用户定位、业务定位、设计定位”,

  • 标签: 用户定位 设计 产品 导流 用户体验 业务定位
  • 简介:Combimouse分体键盘分体键搏该多功能键盘主体分为左右两个部分,不但如此,左半边键盘设计了一个鼠标滚轮,而右半边可以作为一个光电鼠标来用。当按下右边的“ContactSwitch”键以后,右边的部分就转换成了光电鼠标模式,“IOJKL”这五个按键就变成了鼠标的按键。

  • 标签: 产品推荐 多功能键盘 SWITCH 鼠标滚轮 光电鼠标 键盘设计
  • 简介:MartyCagan是享有世界声誉的产品管理专家,曾经担任网景副总裁、eBay产品管理及设计高级副总裁。本文是他合伙人回顾多年来从事软件产品营销工作的总结和经验分享,分析了产品营销的价值,并分享了文案写作的经验。

  • 标签: 产品营销 产品管理 EBAY 营销工作 软件产品 总裁
  • 简介:K.TORPowerBox是一款迷你便携式动力充电器,体积大约只有12×22厘米.重不到1公斤、正如你所见,将这个充电器展开后,

  • 标签: 产品 POWER 充电器 便携式 迷你
  • 简介:XMind3.0.3思维导图软件XMind最近发布了一个更新版本3.0.3。XMind3.0.3添加的新特性如下:崩溃恢复功能;主题文本对齐;导出为FreeMindMap;使用Ctrl+鼠标滚轮缩放Map;能够查找替换Label、RelationShiP和Boundary、SUmmary以及RichTextNotes中的内容;自动超链接;RichTextNotes支持拼写检查;通过xmind—pxxx.xmind命令行可以进入幻灯演示模式(Windows)。

  • 标签: 工具 产品 NOTES 恢复功能 文本对齐 鼠标滚轮
  • 简介:NetBeans6.0正式发布近日,Sun宣布NetBeansIDE的6.0版本正式发布。Sun表示NetBeans6.0将把所有NetBeans产品整合到一个package中。新的IDE将免费发布在GPLy2协议和Sun的CommonDevelopmentandDistributionLicense(CDDL)之下。

  • 标签: 产品 PACKAGE 工具 SUN IDE 协议
  • 简介:赛门铁克推出革新的ThreatCon安全预警系统;IBM发布Notes/Domino8.0;BEA交付WebLogicServer虚拟版;CodeGear公司发布JGear;红旗发布Asianuxserver3.0;用友华表发布BillOne组件,插件产品

  • 标签: WebLogicServer 产品 工具 安全预警系统 SERVER NOTES
  • 简介:Office2007SP2Office2007SP2在4月份通过WindowsServerUpdateServices发布。SP2拥有很多重要功能,包括:支持保存为ODF和PDF格式;提升了Outlook性能,增强了Outlook日历的可靠性;修复了核心Office应用软件中的图表漏洞;提供了SP客户端卸载工具;新增了很多用户对OfficeServer产品提出的改进;Office2007SP2包括自Office2007以来的所有补丁。

  • 标签: 卸载工具 产品 OFFICE OUTLOOK SERVICES SERVER
  • 简介:如今,每个人都或多或少有点。隐私。不想被他人知晓。那应该如何保护呢?除了借助专业的隐私清理或者加密工具外,其实.动动手,挖掘一下我们经常使用的软件,也会有很大的收获,比如迅雷新版就具有“私人空间”,而QQ电脑管家也具备。文件保险柜’的功能,下面一起来看看。

  • 标签: 私人空间 隐私 挖掘 加密工具 保险柜
  • 简介:在2003和2004年,数码相机的销量创造了历史新高,而多功能一体机也受到了用户的青睐。受这两种产品的冲击,用户对数码影像和商务办公应用的需求正在被分流,原来扫描仪的主力市场家用扫描仪市场开始出现滑坡,这在一定程度上导致了扫描仪市场开始出现”需求”危机,中国扫描仪市场出现下滑。

  • 标签: 扫描仪 数码影像 扫描速度 分辨率
  • 简介:随着SQLServer2005本发布的临近,现在是时候讨论它为数据库开发人员带来的一些新特性了。为了激发您的好奇心,最好还是从SQLServer2005AnalysisServices的数据挖掘新特性开始吧!其中,您将会发现它改进了两个现有算法,引入了五个新算法,并增加了十多个可视化界面帮助处理数据关联。如果只是粗略的看一眼,则会错过所有的强大功能。

  • 标签: Analysis Services 数据挖掘 特性 Server 揭秘
  • 简介:随着数据库应用的不断深化,数据库的规模急剧膨胀,人们需要对这些数据进行分析,从中发现有价值的信息。但是数据库管理系统本身却没有提供有效的工具和方法来利用这些数据,因此数据挖掘成为当今研究的热点。本文即以混合遗传算法为基础对数据挖掘中的算法问题进行系统研究。

  • 标签: 数据挖掘 遗传算法 模拟退火算法 混合遗传算法
  • 简介:在这个火热的夏天,移动开发领域也是一番热火朝天。iPhone3GS发布,除修补MMS等小缺陷外,"提速"成为了关键词。在功能为王的今天,能够下定决心不增加新功能,而是一心一意地将性能和用户体验做好,苹果的确值得我们学习。PlamPre几乎同时发布,在手机互联网如何结合的问题上,WebOS又一次走在了技术的前沿,所有的应用都基于HTML和JavaScript。

  • 标签: JAVASCRIPT 产品 IPHONE Plam HTML MMS
  • 简介:团队管理的基本目标是:让所有成员有条不紊地开展工作.在预定的时间和成本之内.开发完成质量合格的产品,从而使企业和个人获得预定的利益。

  • 标签: 企业 产品 基本目标 团队管理 利益 成本