学科分类
/ 24
461 个结果
  • 简介:数据结构设计的重要目标之一是提高操作速度,特别是检索速度。局部平衡的红黑、平衡的AVL等二叉搜索具有良好的检索性能,非常适合于基于内存的索引,但为防止树形结构退化为线性结构,在插入和删除结点时经常需要旋转,维护数据结构的操作比较复杂。文章阐述伸展在检索过程中通过自动调整结构,使访问最频繁的结点靠近树结构的根,从而减少访问代价,指出伸展可以作为各种线性序列的索引组织方法,能在一些需要高效索引的大工程中加以运用。

  • 标签: 数据结构 索引 二叉搜索树 伸展树
  • 简介:Windows操作系统从Windows9.5发展到了今天的Windows2003,资源管理器在功能上一直没有大的改变,一方面是熟悉的操作习惯,一方面是不强大的功能,让资源管理器成为了很多Windows用户心目中的“鸡肋”……

  • 标签: WINDOWS 操作系统 资源管理器 文件夹 应用程序
  • 简介:在数据集中挖掘频繁模式是数据挖掘研究的关键环节之一。在过去,很多的努力都集中在独立数据的挖掘上。然而,现实世界中许多实体之间总会保持着千丝万缕的关系。如何获得这些关系的频繁模式,已逐渐成为近年来研究的一个目标,我们将它称之为频繁结构的挖掘。在数据挖掘中,一个重要的方法是关联规则挖掘。它被用来发现频繁出现在数据库事务中的项集;另一个重要的方法是序列挖掘,它的任务是去寻找一个项集的序列。这些挖掘任务都被称为频繁模式的挖掘。

  • 标签: 频繁模式 项集 挖掘算法 数据挖掘 关联规则挖掘 事务
  • 简介:随着网络技术的发展,虚拟局域网(VLAN)在网络中的应用越来越广。为了更加有效的对VLAN进行管理,本文提出了一种基于、VLAN的网络拓扑发现算法,该算法基于生成协议,通过获取每VLAN中的生成信息.来推导出每VLAN的网络拓扑结构,从而达到管理的目的。

  • 标签: 虚拟局域网 生成树协议
  • 简介:多媒体教学在新课程实践中尽显魅力,它克服了许多传统教学的缺陷和不足,在培养学生的创新能力、个性发展方面有着无可比拟的优势。可是使用不当,也会成为教学的毒药。

  • 标签: 多媒体教学 课程实践 传统教学 创新能力 个性发展
  • 简介:通过扩充情感词典词基数,新建中立词词典,引入网络流行词等方式丰富情感词典,提高分词后情感词匹配的准确性;以某评价类网站网民评论作为原始数据进行分词,提取相应的正向情感分数,负向情感分数,中立情感词个数,评论情感总分值等特征,通过对连续数据的规约提炼离散属性,按照信息增益最大原则生成决策进行评论的情感分类,去除小概率节点后进行两次实验,对好评的识别率达到90%,对差评的识别率达到92%。对中评的识别率达到75%。

  • 标签: 情感词典 特征 信息增益 决策树
  • 简介:摘要本文对传统的XML文档模型和路径模型算法进行了研究,在准确率、召回率和平均时间消耗上进行了比较,对两模型算法的特点和不足进行了总结。

  • 标签: XML 树模型 树路径模型 算法
  • 简介:频繁模式的挖掘是数据挖掘领域中一个非常重要的问题,目前在高效、可扩展的频繁模式挖掘算法方面有大量研究。已有频繁模式挖掘算法大致分为两类:基于候选生成一测试策略的Apriori算法以及基于分而治之策略的频繁模式增长算法。已有的工作大多都假设待挖掘的数据是不变的。实际

  • 标签: 频繁模式树 挖掘算法 分而治之 可扩展 APRIORI算法 数据挖掘
  • 简介:3 平衡二叉的插入算法的实现 ,}}…4 平衡二叉的删除算法的实现 ,为了得到平衡二叉的插入算法

  • 标签: 动态演示 树算法 演示设计
  • 简介:本文作者从实际应用出发,对现存数据挖掘决策分类方法进行了研究,并应用到系统当中,实现了决策支持模块。关键词数掘挖掘;决策算法;改进;实现中图分类号TP301.6文献标识码A文章编号1007-9599(2010)04-0000-02DataMiningDecisionTreeImprovement&ImplementationXiaYan,ZhouXiaohong,WangDong(ChangchunTechnologyCollege,Changchun130033,China)AbstractTheauthorstudiedonexistingDataMiningdecisiontreeclassificationmethodbasedonthepracticalapplication,andappliedtothesystem,achievedadecisionsupportmodule.KeywordsDataMining;Decisiontreealgorithm;Improve;Achieve随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将会产生重要的作用。因此,数据挖掘涉及的学科领域逐渐扩大,数据挖掘的方法也在不断地改进和提高。分类在数据挖掘中是一项非常重要的任务,分类算法可以分为决策分类算法、遗传算法、神经网络方法、K-最近邻分类算法等。这里,以疾病防控与儿童免疫管理系统中决策支持子系统的开发过程为例,对决策分类算法的改进及在实际中的应用进行阐述。一、数据选取和数据预处理在本系统中,以预防接种中遇到异常反应后记录的“异常反应调查表”中的数据为例进行说明。具体实现过程详细说明首先输入训练集,由于在真实的SQLServer数据库当中,为了降低存储要求和减少存储时间,并非真正存储每个数据项的属性值,而是用存储数字来对应相应的意义,如在数据库的数据表中,“性别”字段中“1”代表“男”、“2”代表“女”,反应到程序页面时再映射回原来的值,为了说理清晰又限于篇幅,这里只将所有数据集中有代表性的十几组数据作为分类模型创建的输入训练集。表1判断是否需要计划外加强免疫的属性表儿童编号月龄出生状态常住地上次注射后反应是否需要计划外加强免疫0405102<=2正常产城市无不良反应否0405495<=2正常产农村无不良反应否0401342>5正常产城市无不良反应是04054352…5正常产城市轻度反应是04065342…5非正常产城市重度反应是04072342…5非正常产农村重度反应否0401544>5非正常产农村重度反应是0408519<=2正常产城市轻度反应否0404566<=2非正常产城市重度反应是04035472…5非正常产城市轻度反应是0401534<=2非正常产农村轻度反应是0405856>5正常产农村轻度反应是0409533>5非正常产城市无不良反应是04053442…5正常产农村轻度反应否二、生成决策对训练集的每一个属性,计算其信息增益。以“月龄”属性为例,每个结点中的正反例的个数分别为[2,3]、3,2、4,0,分别计算如下info2,3==0.971;info3,2==0.971;info4,0=0;计算信息熵E(月龄)==0.693;计算该属性的信息增益量,选取信息增益最大的属性为节点,按该属性的值划分数据集合Gain(月龄)=Info(9,5)-E(月龄)=0.940-0.693=0.247;同理,对“注射反应”属性、“出生状态”属性、“常住地”属性都可计算每个结点的正反例的个数(由于篇幅有限,不作计算)。通过对各属性信息增益的计算结果,选择“月龄”属性作为根节点,然后划分“月龄<=2”的所有可能性。计算当“月龄<=2”时,“注射反应”、“出生状态”、“常住地”的信息增益值Gain(注射反应)=Info(2,3)-E(注射反应)=0.971-0.4=0.571;Gain(出生状态)=Info(2,3)-E(出生状态)=0.971-0=0.971;Gain(常住地)=Info(2,3)-E(常住地)=0.972-0.951=0.020;同理考虑“月龄>5”的情况,由于“月龄>5”时,各个节点都是纯节点,所以不再划分。三、产生决策规则遍历决策,输出叶结点类属性值,用IF—THEN形式表达为IF(月龄2…5AND注射反应=无)THEN(类别=是)IF(月龄2…5AND注射反应=轻)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=正常产)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=城市)THEN(类别=否)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=农村)THEN(类别=是)……依此类推,共可产生十三条规则。、决策支持子系统的分析用上述基于决策的分类算法所得到的模型生成的规则来预测测试集中的未知数据属于哪一类,并通过该模型的测试结果与实际情况相吻合的准确率来判断该决策是否有效。首先,用整个数据集中2/3的数据作为训练集按照基于决策的分类算法来建立模型,生成一棵决策。然后,用余下的1/3的数据作为测试集,通过创建的模型进行预测,并将预测结果和实际值进行比较。如果准确率达到或超过事先确定的阈值,则可以认定该模型对于数据分类是有效的,能够在实际中应用;反之,则认定该模型的分类效果不好,需要按以上步骤来重新判断,直到分类准确率达到预定的阈值为止。在本系统中,经过测试预测准确率已达到87%,在可以接受的范围内,所以算法是有效、可行的。参考文献1陈文伟,黄金才.数据仓库与数据挖掘.人民邮电出版社,20042王万森.人工智能原理及应用.电子工业出版社,20003范明,孟小峰.数据挖掘——概念与技术.机械工业出版社,2001作者简介夏琰(1980-),女,吉林长春人。长春职业技术学院信息技术分院,教师,讲师,硕士,研究方向为计算机应用。

  • 标签:
  • 简介:我的家乡二九一农场季非常美。春天的田野里,农民伯伯正在播种,稻田里注入了清清的河水及地下水,清水映着蓝天、白云,插秧机在稻田里耕作着,一排排稻秧贪婪地吮(shǔn)吸着泥土的养分。绿油油的麦苗茁壮成长,好像给大地铺上了一层绿色的地毯。我打心眼里爱着这生机勃勃的场景。夏天,农家小院的猪圈里,小猪依偎在母猪的身旁,正在熟睡。

  • 标签:
  • 简介:向被选择的节点发送邀请其成为我的孩子节点的请求包(以j为根的),向选择好的节点发送邀请其成为我的孩子节点的请求包(以’我’为根的),每个节点都需要生成一棵以其为根的

  • 标签: 不定叉树 叉树应用层 应用层组
  • 简介:构件的合理分类是实现构件高效检索的基础和关键。针对目前应用广泛的刻面分类方法存在主观性因素的弊端,采用刻面分类和全文检索相结合的方法来描述构件。在此构件描述的基础上,利用聚类分析技术和语义分析技术提出一种基于语义的构件聚类索引。并通过实验验证,该聚类索引是可行的,有效地克服刻面分类方法的缺点,在一定程度上实现对构件的语义检索,而且具有较高的构件查全率和查准率。此外,用户在描述检索条件时,不再局限于限定的术语,更方便于普通用户。

  • 标签: 构件 刻面分类 聚类分析 语义分析 索引树
  • 简介:该文在描述决策分类算法的基础上,叙述了决策分类算法用于网络入侵检测领域,给出了决策分类模型的构造过程,并说明了应用基于决策模型检测入侵的过程。最后用KDDCUP99数据进行实验,验证了用本文描述的方法检测入侵行为的有效性。

  • 标签: 决策树 入侵检测 分类模型