学科分类
/ 25
500 个结果
  • 简介:提出采用事务压缩和哈希技术相结合方式的改进算法.该算法通过备份数据库Dk生成候选项目集Ck,在生成Ck的同时计算支持度.针对生成频繁2-项目集L2的瓶颈,在生成L2的时候使用DHP算法.从时间复杂度上对Apriori算法和改进算法进行比较,说明改进算法在效率上优于Apriori算法.

  • 标签: 关联规则 APRIORI DHP算法
  • 简介:摘要关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法是关联规则挖掘中的经典算法。本文在对Apriori算法分析的基础上,针对该算法存在的缺陷,即会产生大量冗余的候选集并频繁扫描数据库,提出了改进的Apriori算法,并给予验证。实践证明,改进后的算法效率优于传统的算法

  • 标签: 数据挖掘 频繁项集 Apriori算法 关联规则
  • 简介:基于临时表的Apriori改进算法,本文提出了基于临时表的Apriori改进算法,而基于临时表的改进算法在第二趟数据扫描后

  • 标签: 改进算法 表改进
  • 简介:基于Flink平台对并行Apriori算法进行设计和实现.采用MapReduce计算框架对并行Apirori算法的迭代过程进行设计,并将Flink的流处理和内存缓存应用于算法的实现,从而了Apriori算法在并行计算下的挖掘速度.实验结果表明,基于Flink平台实现的并行Apriori算法对大数据处理有着良好的适应能力,并且在算法迭代次数和迭代产生的频繁项集较多的情况下,拥有较快的挖掘速度.

  • 标签: 数据挖掘 并行计算 Flink平台 APRIORI算法
  • 简介:随着大量需要被挖掘的数据变得越来越复杂,多维关联规则已经成为关联规则挖掘中最实用的内容之一.本文主要介绍了在多维关联规则挖掘过程中,针对同一种属性数据出现重复连接的情况,由此而提出的一种解决方案.通过对多值属性信息进行比较,去除重复连接的属性信息,保留有效信息,减少对数据库的扫描.由此对Apriori算法中连接步进行改进,最后通过布尔型关联规则挖掘数据信息并得到结果.相较于Apriori算法,改进算法能更加快速准确地发现知识,缩短挖掘所用的时间.

  • 标签: 多维关联规则 多值属性 APRIORI算法 布尔型关联规则
  • 简介:摘要本文根据电力系统访问日志记录,构建用于挖掘的数据集。在Spark环境下,使用并行化的Apriori算法,对可能产生问题的相关设备组构建频繁项集,形成系统故障自动诊断报告。本文以国网甘肃电力公司系统1400w条日志记录作为数据集,采用该方法进行了检验。结果表明该方法能够有效发现相关问题设备组。同时,该算法在80G内存,10个虚拟节点的集群上以10秒的速度完成了频繁项集挖掘,与专家判断对比,准确率达到99%,实现了预期效果。

  • 标签: 电力日志 Spark Apriori 关联规则挖掘
  • 简介:本文利用数据挖掘技术中的APRIORI算法,基于MATLAB软件平台,分析27442名银行个人贵宾客户的产品交叉销售情况,挖掘出属性与属性间的关联规则。根据产品的关联度指标,提出银行产品群中具有拉动力的"楔子产品"定义;根据计算出的强关联规则,提出可推行的组合营销产品组合,为银行的精准营销提供现实依据。通过数据挖掘分析个人贵宾客户的消费特征,为制定全面客户营销策略提供了现实依据。

  • 标签: APRIORI算法 产品交叉销售 关联分析 精准营销
  • 简介:提出了一种改进的基于fp-tree的Apriori算法.该算法先用尾元将fp-tree分区,生成数据量更小的子数据集,再动态删除冗余数据将子数据集的数据进一步压缩,最后通过扫描子数据集进行支持数统计,从而快速挖掘.实验结果表明,在对含有大量高维度数频繁项集的数据集进行挖掘时,这个改进算法的挖掘速度较快.

  • 标签: 数据挖掘 关联规则 fp-tree结构 APRIORI算法
  • 简介:摘要针对公安交管业务异常数据人工评估效率低、覆盖范围小、难以为业务开展提供有效指导等突出应用问题,研究基于Apriori算法的公安交管综合业务相关性研判模型,为公安交管业务异常数据分析研判的常态化开展提供有效的技术保障,有效增强公安交管核心业务数据质量。

  • 标签: 公安交管业务异常数据 关联规则 Apriori算法
  • 简介:利用一个改进的Apriori算法对高校生源进行分析,找出学生基本信息与大学专业课成绩以及综合测评之间的联系,发现信息之间的相互联系与影响。从而为高校学生管理部门提供决策支持,提高学生的管理水平。

  • 标签: 事物数据库 关联规则 APRIORI算法
  • 简介:针对数据挖掘在网络游戏中的应用,提出了游戏访问模式挖掘的概念,并给出一种适用于挖掘游戏访问模式的Apriornie-GAPM算法,该算法基于Apriori算法思想,采用trie树生成并存储频繁项集,trie树生成采用宽度优先策略,按游戏访问频繁度升序生成每层节点,节点支持度计算应用事务投影策略并结合了游戏使用时间.

  • 标签: 网络游戏 游戏挖掘 APRIORI TRIE树 游戏访问模式
  • 简介:为了分析网络教学平台学习者操作路径,文章采用改进的Apriori算法对网络教学平台学习者频繁访问路径的分析,反馈平台的教学效果。Apriori算法是一种用于关联规则挖掘的代表性算法,是数据挖掘中的一个非常重要的研究方向。将改进后的Apriori算法应用到网络教学平台的频繁访问路径当中进行数据挖掘测试,通过与传统Apriori算法进行对比,改进后的Apriori算法可以得到求满足最小支持度的所有频繁路径的算法,效果明显地改进,并将结果反馈给网络教学平台用户。

  • 标签: 关联规则 APRIORI算法 频繁访问路径 教学平台
  • 简介:数据挖掘(DataMining)是一个利用各种方法,从海量的有噪声的凌乱数据中,提取隐含和潜在的对决策有用的信息和模式的过程[1]。关联分析的目的是要寻找事物间的联系和规律,发现它们间的关联关系。数据挖掘中,关联分析的主要技术是关联规则,1993年由Agrawal等首次提出,有Apriori、GRI、Carma等经典算法。本研究应用Apriori算法探索慢性传染性疾病与用药之间关联关系,找出问题、分析、提出建议与对策,以供临床医师、药师参考。

  • 标签: APRIORI 数据挖掘 恩替卡韦 肺部感染 替比夫定片 传染病患者
  • 简介:Amethodforminingfrequentitemsetsbyevaluatingtheirprobabilityofsupportsbasedonassociationanalysisispresented.Thispaperobtainstheprobabilityofevery1-itemsetbyscanningthedatabase,thenevaluatestheprobabilityofevery2-itemset,every3-itemset,everyk-itemsetfromthefrequent1-itemsetsandgainsallthecandidatefrequentitemsets.Thispaperalsoscansthedatabaseforverifyingthesupportofthecandidatefrequentitemsets.Last,thefrequentitemsetsaremined.Themethodreducesalotoftimeofscanningdatabaseandshortensthecomputationtimeofthealgorithm.

  • 标签: 结合规则 运算法则 评估 概率
  • 简介:针对经典的Apriori算法需要多次扫描数据库,不适合大规模数据这个问题,提出了一种改进的Apriori算法.该算法采用布尔向量关系运算思想,将事务数据库扫描后转化成压缩矩阵,在MapReduce框架下将压缩矩阵进行分块,每块分别被做并列式处理.利用分压缩矩阵快速计算所有的候选项集,从中产生频繁K-项集,降低了Apriori算法的时间复杂度.

  • 标签: 关联规则 MAPREDUCE 压缩矩阵 APRIORI
  • 简介:针对高校与企业机械类创新人才双向流动的特点,提出了一种基于本体及关联规则的决策系统构建方法,设计并实现了以Apriori算法为核心的满足长效机制的人才双向流动决策系统。该系统按照人才的流动情况构建了本体,在此基础上利用改进的Apriori算法对本体知识进行挖掘。实验结果表明该算法减少了扫描次数,提高了挖掘效率。

  • 标签: 机械 人才 决策系统 APRIORI 本体
  • 简介:21世纪是信息时代,信息在社会中的地位越来越重要,已成为社会发展的重要战略资源,信息技术改变着人们的生活和工作方式,与此同时,信息安全也已成为世人关注的社会问题。本文介绍了保证信息安全的一种方法:数据加密标准(即DES),重点阐述单钥密码体制中的分组密码的基本概念、结构和加密算法

  • 标签: DES 密钥 明文 密文
  • 简介:摘要:数据结构作为计算机科学的核心,已经成为人们必须掌握的一切信息知识。作为经典的最短路径算法,Dijkstra算法数据结构被在生活中的各方面都有所体现。本文从数据结构和最短路径算法的定义入手,介绍了Dijkstra算法算法优缺点和算法实例,最后阐述了最短路径算法在现实生活中的作用,说明该算法的重要意义。

  • 标签: 最短路径 Dijkstra算法 应用
  • 简介:Inthepost-genomicera,variouscomputationalmethodsthatpredictprotein-proteininteractionsatthegenomelevelareavailable;however,eachmethodhasitsownadvantagesanddisadvantages,resultinginfalsepredictions.Herewedevel-opedauniqueintegratedapproachtoidentifyinteractingpartner(s)ofSemaphorin5A(SEMA5A),beginningwithsevenproteinssharingsimilarligandinteractingresiduesasputativebindingpartners.ThemethodsincludeDwyerandRoot-Bernstein/Dillontheoriesofproteinevolution,hydropathiccomplementarityofproteinstructure,patternofproteinfunctionsamongmolecules,informationondomain-domaininteractions,co-expressionofgenesandproteinevolution.AmongthesetofsevenproteinsselectedasputativeSEMA5Ainteractingpartners,wefoundthefunctionsofPlexinB3andNeuropilin-2tobeassociatedwithSEMA5A.WemodeledthesemaphorindomainstructureofPlexinB3andfoundthatitsharessimilaritywithSEMA5A.Moreover,avirtualexpressiondatabasesearchandRT-PCRanalysisshowedco-expressionofSEMA5AandPlexinB3andtheseproteinswerefoundtohaveco-evolved.Inaddition,weconfirmedtheinterac-tionofSEMA5AwithPlexinB3inco-immunoprecipitationstudies.Overall,thesestudiesdemonstratethatanintegratedmethodofpredictioncanbeusedatthegenomelevelfordiscoveringmanyunknownproteinbindingpartnerswithknownligandbindingdomains.

  • 标签: 蛋白质结构 相关蛋白 相互作用 APRIORI 互补 后基因组时代