学科分类
/ 1
11 个结果
  • 简介:数据结构设计的重要目标之一是提高操作速度,特别是检索速度。局部平衡的红黑、平衡的AVL等二叉搜索具有良好的检索性能,非常适合于基于内存的索引,但为防止树形结构退化为线性结构,在插入和删除结点时经常需要旋转,维护数据结构的操作比较复杂。文章阐述伸展在检索过程中通过自动调整结构,使访问最频繁的结点靠近树结构的根,从而减少访问代价,指出伸展可以作为各种线性序列的索引组织方法,能在一些需要高效索引的大工程中加以运用。

  • 标签: 数据结构 索引 二叉搜索树 伸展树
  • 简介:在数据集中挖掘频繁模式是数据挖掘研究的关键环节之一。在过去,很多的努力都集中在独立数据的挖掘上。然而,现实世界中许多实体之间总会保持着千丝万缕的关系。如何获得这些关系的频繁模式,已逐渐成为近年来研究的一个目标,我们将它称之为频繁结构的挖掘。在数据挖掘中,一个重要的方法是关联规则挖掘。它被用来发现频繁出现在数据库事务中的项集;另一个重要的方法是序列挖掘,它的任务是去寻找一个项集的序列。这些挖掘任务都被称为频繁模式的挖掘。

  • 标签: 频繁模式 项集 挖掘算法 数据挖掘 关联规则挖掘 事务
  • 简介:随着网络技术的发展,虚拟局域网(VLAN)在网络中的应用越来越广。为了更加有效的对VLAN进行管理,本文提出了一种基于、VLAN的网络拓扑发现算法,该算法基于生成协议,通过获取每VLAN中的生成信息.来推导出每VLAN的网络拓扑结构,从而达到管理的目的。

  • 标签: 虚拟局域网 生成树协议
  • 简介:通过扩充情感词典词基数,新建中立词词典,引入网络流行词等方式丰富情感词典,提高分词后情感词匹配的准确性;以某评价类网站网民评论作为原始数据进行分词,提取相应的正向情感分数,负向情感分数,中立情感词个数,评论情感总分值等特征,通过对连续数据的规约提炼离散属性,按照信息增益最大原则生成决策进行评论的情感分类,去除小概率节点后进行两次实验,对好评的识别率达到90%,对差评的识别率达到92%。对中评的识别率达到75%。

  • 标签: 情感词典 特征 信息增益 决策树
  • 简介:频繁模式的挖掘是数据挖掘领域中一个非常重要的问题,目前在高效、可扩展的频繁模式挖掘算法方面有大量研究。已有频繁模式挖掘算法大致分为两类:基于候选生成一测试策略的Apriori算法以及基于分而治之策略的频繁模式增长算法。已有的工作大多都假设待挖掘的数据是不变的。实际

  • 标签: 频繁模式树 挖掘算法 分而治之 可扩展 APRIORI算法 数据挖掘
  • 简介:构件的合理分类是实现构件高效检索的基础和关键。针对目前应用广泛的刻面分类方法存在主观性因素的弊端,采用刻面分类和全文检索相结合的方法来描述构件。在此构件描述的基础上,利用聚类分析技术和语义分析技术提出一种基于语义的构件聚类索引。并通过实验验证,该聚类索引是可行的,有效地克服刻面分类方法的缺点,在一定程度上实现对构件的语义检索,而且具有较高的构件查全率和查准率。此外,用户在描述检索条件时,不再局限于限定的术语,更方便于普通用户。

  • 标签: 构件 刻面分类 聚类分析 语义分析 索引树
  • 简介:该文在描述决策分类算法的基础上,叙述了决策分类算法用于网络入侵检测领域,给出了决策分类模型的构造过程,并说明了应用基于决策模型检测入侵的过程。最后用KDDCUP99数据进行实验,验证了用本文描述的方法检测入侵行为的有效性。

  • 标签: 决策树 入侵检测 分类模型
  • 简介:基于多类别肿瘤基因表达谱数据集,从研究肿瘤与正常组织的分类入手,对肿瘤分类特征基因选取问题进行分析和研究。将决策算法应用到肿瘤基因表达谱分类研究中,尝试引入遗传算法,对决策分类规则进行优化。试验结果表明,在样本有限的情况下,该方法比单个决策具有更高的分类精度。

  • 标签: 肿瘤 遗传算法 肿瘤基因表达谱 决策树 特征基因
  • 简介:该文首先对决策技术相关理论和SQLServer2008BI平台作了介绍,然后对用于挖掘分析的数据源进行了预处理。利用SQLServer2008BI平台下的决策分类技术和DMX语言即数据挖掘扩展语言创建了课程成绩分析决策模型。挖掘提升图和分类矩阵对该模型的评估结果表明模型具有较高的可靠性和分类准确度,同时模型对应的一些规则和模式可作为课程教学管理及改革的重要参考依据。

  • 标签: 决策树技术 SQL SERVER 2008BI平台 ETL过程 DMX语言