学科分类
/ 25
500 个结果
  • 简介:诸如医学、个人档案管理等领域中的数据挖掘截然不同于其它领域的数据挖掘,它的一个最大的特征就是涉及到人这个主体及其隐私问题,因此有着广泛的社会影响。通过从伦理、法律社会的限制,主体记录的处理及相关算法、数据挖掘者的责任等方面的研究,提出私有数据挖掘中的个人隐私社会影响问题及其解决办法。

  • 标签: 数据挖掘 数据算法 隐私
  • 简介:随着中国加入WTO国内电信业的改革,各电信运营商在企业大用户、长途电话、IP业务等各方面展开了激烈的竞争。可以看到电信市场上,运营商们正层出不穷地推出新的增值业务和服务,并不断重申深度挖掘基础业务提供ARPU值的重要性,应该说电信营销已经从混沌状态走到了一种理智清晰的状态。在这种状况下,找到ARPU贡献率高的用户、提供有竞争力的业务、提高用户满意度以及用户忠诚度,无疑需要建立一种理性的决策方式。而理性决策的获得总是脱离不

  • 标签: 企业 中国 电信营销 ARPU值 电信业 用户忠诚度
  • 简介:用户访问数据中往往存在大量无用或与当前信息挖掘无关的数据,我们通过数据清洗从挖掘对象中去除不相关的数据,并实现了用户识别、会话识别、格式化等步骤,对WEB信息进行预处理,为进一步的操作提供了较好的数据格式,提高了挖掘效率。同时,因特网上的信息往往具有非结构化或半结构化特性,难以得到传统数据挖掘技术的支持,我们通过事务识别技术解决了这一问题,将访问序列组织成逻辑单元以表示事务或用户会话,将所有事务组成一个事务数据库,识别出事务后就可以利用对传统数据挖掘的方法对WEB数据进行挖掘:事务识别技术有多种实现形式,不同形式有不同的应用场合,本文根据特定挖掘任务,实现了以时间维来分割事务的算法,并给出了一些实验数据。

  • 标签: 数据库 数据处理 数据库管理系统 WEB 数据挖掘 数据格式
  • 简介:本文在对数据挖掘相关技术、关联规则挖掘算法进行深入研究的基础上,归纳总结了基于粗糙集理论的关联规则挖掘模型属性约简算法,并将其应用于高校教师的成长中。

  • 标签: 粗糙集 关联规则 教师成长 属性约简
  • 简介:  (二)Aprior算法  Apriori算法是一种挖掘布尔关联规则的频繁项集的算法,  3)把各类频繁的属性单项频繁的图书分类单项连接成2-候选频繁项集,然后由频繁项集产生关联规则

  • 标签: 关联挖掘 实践应用 挖掘算法
  • 简介:随着互联网的高速发展,Web挖掘由于其独特的优点,在电子商务的应用中扮演了越来越重要的角色。文章主要介绍了web挖掘的概念分类,论述了电子商务中Web挖掘的过程方法,最后阐述了Web挖掘在电子商务中的具体应用

  • 标签: WEB挖掘 电子商务 数据挖掘
  • 简介:随着计算机网络技术的快速发展及大数据时代的到来,大数据技术在旅游行业中也得到了有效应用,智慧旅游成为旅游行业发展的一个主流趋势。大数据挖掘在智慧旅游建设推进中有着重要的作用,基于此,本文对大数据挖掘在智慧旅游中的应用进行了探讨,旨在提高大数据挖掘技术在旅游发展中的应用,促进智慧旅游的实现。

  • 标签: 大数据 挖掘 智慧旅游
  • 简介:Web服务器日志记录用户访问该教学网站时每个页面的请求信息,可以根据用户访问的Web记录挖掘用户的兴趣关联规则,对Web服务器上的日志、用户信息等数据所开展的挖掘工作也属于Web数据挖掘的范畴

  • 标签: 中的应用 挖掘网络 日志挖掘
  • 简介:本文首先介绍了Web挖掘电子学习(e—learning)&其在商业教育中的应用,然后在WebCT学习环境中对学生成绩做了一个模式分类的预测实验,证明了Web挖掘可以成为构建e—learning知识的一种方法,具有改善学生学习模式的潜在作用。

  • 标签: E—learning(电子学习) WEB挖掘 课程管理系统(CMS) 数据挖掘 WEBCT
  • 简介:信息技术的发展推动了档案事业的发展,而数据挖掘技术在档案管理系统中的应用是为了提高档案利用率,实现档案服务的必然。本文从数据挖掘技术的相关内容入手,论述了数据挖掘技术的基础知识,并结合数据挖掘技术在档案管理系统中的具体应用进行了分析与探讨。

  • 标签: 数据挖掘技术 档案管理系统 档案事业
  • 简介:  一、数据挖掘的定义  数据挖掘是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,大多数关联规则挖掘算法能够无遗漏发现隐藏在所挖掘数据中的所有关联关系,粗糙集理论可以应用于数据挖掘中的分类、发现不准确数据或噪声数据内在的结构联系

  • 标签: 技术研究 数据挖掘技术
  • 简介:在本刊以前的文章中,我为大家介绍了一些关于For命令的知识。包括如何使用For命令为一个不具备处理通配符能力的应用程序具有通配符的功能。例如,如果需要对所有以z开头的文件执行Processfile,你可以输入下列命令:

  • 标签: 命令 补遗 挖掘 应用程序 通配符 文件
  • 简介:本文首先讨论了数据挖掘技术,给出了一种企业决策系统。并就决策系统的构成、流程采用的数据挖掘技术进行了探讨。关键词数据挖掘;数据仓库;企业决策系统中图分类号N37文献标识码A文章编号1007-9599(2010)04-0000-01ResearchofDataMiningTechnologyinBusinessDecision-makingSystemShiDongsheng(InnerMongoliaUniversity,Information&EngineeringTechnologyCollege,InnerMongolia,Baotou014010,China)AbstractThispaperdiscussesdataminingtechnology,presentsabusinessdecisionsystem.Decision-makingsystemoncomposition,processanduseofdataminingtechniquesarediscussed.KeywordsDatamining;Datawarehouse;Businessdecision-makingsystem随着计算机管理信息系统的飞速发展广泛应用,企业生产经营的自动化水平不断提高,大大提高了工作效率。但企业业务系统运行所产生的大量原始数据是企业生产经营活动的真实记录,不能为本企业加以有效的统计、分析及评估,无法将这些数据转换成企业有用的信息、为企业战略决策提供参考支持。数据挖掘正是在这样的应用需求环境下产生并迅速发展起来的,它的出现为智能地把海量数据转化为有用的信息知识提供了新的思路手段,设计开发基于数据挖掘的企业决策系统是合理解决这一问题,提升企业综合竞争力的最佳对策。一、数据挖掘技术数据挖掘,是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们不知道的、但又是潜在有用的信息知识的过程。它是数据库研究中的一个新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论技术,把人们对数据的应用从低层次的查询,提升到从数据中挖掘知识,提供决策支持的层级。数据挖掘一般由数据准备、挖掘操作、结果表达和解释三个主要阶段组成。在数据准备阶段应集成多个运作数据源中的数据,解决语义模糊性、处理遗漏数据、清洗脏数据。挖掘阶段是一个假设产生、合成、修正和验证传播的过程,也是上述三个阶段的核心。结果表达和解释阶段根据最终用户的决策目的把提取的有用信息正确地表达出来。数据挖掘的方法技术可大致划分为三类统计分析、知识发现、可视化技术等。统计分析用于检查异常形式的数据,然后利用统计模型和数学模型来解释这些数据,统计分析方法是目前最成熟的数据挖掘工具。而知识发现则着眼于发现大量数据记录中潜在的有用信息或新的知识,属于所谓“发现驱动”的数据挖掘技术途经。知识发现常用的方法有人工神经网络、决策树、遗传算法、模糊计算或模糊推理等。数据质量、可视化数据的能力、极大数据库尺寸、数据挖掘者的技能、数据的粒度都是影响知识发现方法的重要因素。可视化技术则采用直观的图形方式将信息模式、数据的关联或趋势呈现给决策者,决策者可以通过可视化技术交互式地分析数据关系。二、基于数据挖掘的企业决策系统数据挖掘面对的是经初步加工的数据,使得数据挖掘更专注于知识的发现;而数据仓库用于完成数据的收集、集成、存储、管理等工作,两者必须有机结合起来使用。基于数据挖掘的企业决策系统主要由数据库、数据仓库、数据仓库管理模块、知识库、知识发现模块、数据挖掘工具、人机交互模块构成(如下图所示)。系统的输入主要源于经过初步处理的数据库数据以及存储在知识库中的历史知识经验;数据仓库管理模块用于数据仓库的建立以及数据的筛选操作;知识发现模块控制并管理知识发现过程,它将数据的输入知识库中的信息用于驱动数据选择过程、知识发现引擎过程发现的评价过程;人机交互模块通过自然语言处理语义查询在用户系统之间提供相互联系的集成界面。数据挖掘工具用于完成实际决策问题所需的各种查询检索工具、多维数据的联机分析分析工具等,以实现决策支持系统的各种要求。数据挖掘主要提供了以下几种模式(一)分类模式根据数据的值从树根开始搜索,沿着数据满足的分支往上走,直到树叶确定类别。(二)回归模式回归模式与分类模式相似,区别在于分类模式的预测值是离散的,而回归模式的预测值是连续的。(三)时间序列模式根据数据随时间变化的趋势预测将来的值。只有充分考虑时间因素,利用现有数据随时间变化的一系列的值,才能更好地预测将来的值。(四)聚类模式把数据划分到不同的组,组之间的差别尽可能大,组内的差别尽可能小,进行聚类前并不知道将要划分成几个组什么样的组。(五)关联模式利用数据项之间的关联规则。(刘)概念描述比较操作把具有共同性的数据做汇总操作,从而得到一个具有一般性的规则描述。在实际应用中,可以根据具体情况采用不同模式组合,达到最优化的数据挖掘方式。在用户使用该系统时,首先需要通过分析决策需求,描述表示决策的问题,确定数据来源,即可建立数据仓库;其次针对所要发现的任务的所属类别,设计或选择上述有效的数据挖掘算法并加以实现,从平凡的历史数据中提出综合数据,独立存储为库文件,作为更高一层数据挖掘对象;同时测试以评价所发现的知识,对知识进行一致性、效用性处理。最后根据最终用户的要求,建立适用于决策支持的数据仓库的集成界面应用程序,使用户能在决策支持中运用所发现的知识。对于该系统的执行,每个步骤包含了循环反复,可以对发现的知识不断求精、深化,并使其易于理解。三、结论总之,数据挖掘技术可以使其应用者由原来通过定期的、固定的报表进行定性的分析而上升到实时的、动态的各种形式的图表进行定量的分析,从而可以敏感地发现市场的微小变化并迅速做出反应,为企业在激烈的市场竞争中立于不败之地提供了强有力的工具。参考文献1范明,孟小峰.anjiawei,etal.数据挖掘概念与技术M.北京机械工业出版社,20072李捷.基于数据仓库和数据挖掘的企业决策支持系统研究J.科技经济市场,2006,73范丽霞,张雪兰.利用数据仓库和数据挖掘实现电信决策支持系统J.计算机与现代化,2005,8

  • 标签:
  • 简介:四、Web数据挖掘中的关键技术  Web数据挖掘中常用的技术有Web使用的特有的路径分析技术,并对Web数据挖掘中使用的技术及应用前景进行了探讨,    3.Web访问挖掘  Web访问挖掘是从服务器端记录的用户访问日志或从用户的浏览信息中抽取感兴趣的模式

  • 标签: 数据挖掘技术 面向Web Web数据挖掘
  • 简介:定义从页面p指向页面q关于查询关键字k的超链权值为w(p,并对Web结构挖掘的一般方法HITS算法进行改进,如果存在超链从页面p指向页面q

  • 标签: 挖掘算法 算法研究 结构挖掘
  • 简介:在数据集中挖掘频繁模式是数据挖掘研究的关键环节之一。在过去,很多的努力都集中在独立数据的挖掘上。然而,现实世界中许多实体之间总会保持着千丝万缕的关系。如何获得这些关系的频繁模式,已逐渐成为近年来研究的一个目标,我们将它称之为频繁结构的挖掘。在数据挖掘中,一个重要的方法是关联规则挖掘。它被用来发现频繁出现在数据库事务中的项集;另一个重要的方法是序列挖掘,它的任务是去寻找一个项集的序列。这些挖掘任务都被称为频繁模式的挖掘

  • 标签: 频繁模式 项集 挖掘算法 数据挖掘 关联规则挖掘 事务