学科分类
/ 25
500 个结果
  • 简介:基于数据挖掘技术,针对电信故障海量数据特点,合理选择属性值和标签值,运用交叉验证、网格划分、遗传算法和粒子群算法进行参数寻优,运用支持向量机SVM理论,建立电信故障分类模型和预测模型。通过仿真分析,并且与电信故障实际数据对比,表明该分类模型和预测模型的精度高,误差小,为今后控制电信故障,改善网络运行质量提供理论依据和数据支持。

  • 标签: 数据挖掘 SVC SVR 电信故障预测
  • 简介:数据挖掘是当前热门的、具有广阔商业应用前景的一个研究领域。通过对国内外数据挖掘研究现状、算法和应用进行分析,发现国内数据挖掘的应用仍处于初级阶段,最后探讨了数据挖掘的发展趋势,这对我国的数据挖掘研究具有一定的参考价值。

  • 标签: 数据挖掘 综述 发展趋势
  • 简介:粒计算理论是一种看待客观世界的世界观和方法论,覆盖了所有有关粒度的理论、方法、技术和工具的研究,将粒计算理论应用于数据挖掘研究已成为数据挖掘领域的一个研究热点。分析了粒的概念,介绍了粒计算的主要理论模型与方法、粒的信息化与二进制表示,并给出了粒计算理论下关联规则挖掘中求得支持度与置信度的方法。

  • 标签: 粒计算理论 数据挖掘 支持度 置信度
  • 简介:校园站点访问数据作为一种重要的数据样本,有助于掌握高校网站运行情况,为校园站点优化策略的制订和实施提供了重要参考。在高校信息化建设中,数据分析和数据挖掘的范畴已经不仅仅限于学生、科研等传统数据,从高校网站的页面访问中也可以提取到很多有价值的数据和线索。校园站点访问数据作为一种重要的数据样本,有助于掌握高校网站运行情况,为校园站点优化策略的制订和实施提供了重要参考。

  • 标签: 数据挖掘 校园网 高校网站 优化策略 信息化建设 站点
  • 简介:随着教育信息数据不断增加,我们面对大量数据时无法获得最有价值的知识,从而降低了数字化教学资源的作用。以武汉纺织大学线性代数课程为例,用数据挖掘工具wlela,结合关联规则和决策树方法,从往年积累的真实数据挖掘出有价值的信息,为该课程的教学改革提供有力的理论支持。实践表明:数据挖掘技术用于教育中能提高教学效果。

  • 标签: 数据挖掘 关联规则 决策树 教育信息化 E-LEARNING
  • 简介:随着数据库应用的不断深化,数据库的规模急剧膨胀,人们需要对这些数据进行分析,从中发现有价值的信息。但是数据库管理系统本身却没有提供有效的工具和方法来利用这些数据,因此数据挖掘成为当今研究的热点。本文即以混合遗传算法为基础对数据挖掘中的算法问题进行系统研究。

  • 标签: 数据挖掘 遗传算法 模拟退火算法 混合遗传算法
  • 简介:通过数据挖掘技术可以有效地对远程教育中大量的信息资源进行整合统计分析,从而更好地促进远程教育的发展。该文以《现代英语语法》课程为例,运用路径分析、兴趣关联规则分析、聚类分析、序列模式分析等数据挖掘技术,处理学生在线学习该课程的大量数据,以可视化的方式把挖掘结果反馈给学习者和教学管理者,从而实现双赢的结果。

  • 标签: 数据挖掘 远程教育 在线学习 双赢
  • 简介:“十一五”期间,我国提出100处重要大遗址的保护工作。本工作基于大遗址保护数字化保护的具体需要,将大遗址进行分类,并将其与地理信息相关的数据进行编码,建立我国大遗址的地理数据编码标准,以期在大遗址保护中,对大遗址数据库建设和监测起到基础性支撑作用。

  • 标签: 大遗址 分类 地理数据 编码
  • 简介:目的建立一种预处理方法,在进行医疗费用数据挖掘时,将因变量(呈偏态分布的连续性变量)转换为分类变量,从而得到更加科学合理的研究结果。方法以广东省甲型病毒性肝炎医疗费用调查取得的115例患者为研究对象,分别采用中位数的分类方法和K-means聚类的方法作为预处理方法,对医疗费用这一呈偏态分布的因变量进行分类,然后建立支持向量机数学模型,采用支持向量机进行医疗费用影响因素分析;通过比较模型的预测精度、模型收益以及影响因素的筛选结果,确定最优的预处理方法。结果115例甲肝病人甲肝总住院费用中位数为2744.69元,呈偏态分布。应变量以中位数方法分类,采用支持向量机模型筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、性别、疾病类型);采用聚类分析进行数据预处理时筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、住院天数、支付方式)。与中位数方法的分类方法比较,采用聚类分析进行数据预处理时,支持向量机模型结果得到的预测精度由91.30%上升到97.39%;收益图表陡峭地升高到100.00%然后渐渐变得平缓,显示模型收益更好;影响因素筛选结果更加科学合理,符合实际情况。结论聚类分析是一种优秀的数据挖掘预处理方法,具有良好的应用性。

  • 标签: 数据挖掘 聚类分析 卫生保健费用
  • 简介:网络质量优化是一项庞大的系统工程,单纯的靠人工统计和网优工程师个人经验优化的模式无疑存在效率过低和人为经验差异而导致优化效果不理想的问题。大量关于网络优化的新技术研究正在不断地深入进行中,网络优化技术结合日益发展的人工智能、数据挖掘技术将是未来的发展趋势。本文结合人工智能和数据挖掘理论的发展,重点探讨在海量、多维的数据中构造无线网络场景模型的新方法,从而指导参数的精细化调整,帮助网络部门更加准确的定位网络问题并制定网络优化方案。

  • 标签: 质量优化 人工智能 数据挖掘 场景模型
  • 简介:简要介绍了精细化天气预报和气象数据挖掘应用的现状,在对BP神经网络预测方法详细分析的基础上,研究了基于时间序列数据挖掘实现精细化温度预报的方法。该方法基于时序分析技术,建立起适合于BP神经网络的输入样本模型,通过反复学习从温度时序中建立预测模型,将其用于未来24h的精细化温度预报。同时,对BP神经网络算法和步骤做了简要介绍,针对原有的BP算法存在的不足,做了一些改进。最后,通过对预测挖掘系统的设计和在Matlab6.5仿真平台上的试验,建立了温度预报模型,以兰州市观测站数据为时间序列研究对象,对精细化温度预报进行了仿真实现。对基于时序的数据挖掘理论的应用和开发精细化温度预报方法做了有益的探索。

  • 标签: 数据挖掘 精细化温度预报 BP神经网络 预测模型
  • 简介:指挥决策风险存在于军事活动的全过程,决策条件的不确定性决定了风险的存在。首先,使用三元组矩阵完备集的模型描述指挥决策风险;然后,建立了指挥决策风险数据挖掘的模型,并描述了三元组在模型中的位置和作用;最后,讨论使用Apriori算法对三元组模型进行数据挖掘并发现潜在风险。算例表明,该算法为识别评估指挥决策风险提供了一种新的途径。

  • 标签: 指挥决策风险 数据挖掘 三元组模型 APRIORI算法
  • 简介:针对广播电视大学开放教育发展过程中出现的学生流失问题进行剖析,将数据挖掘技术运用到学生流失分析的几个方面:分类、预测、因素分析等等,并为制定控制或减少学生流失情况的对策提供有力的技术支撑,进而推进远程教育能够科学的、合理的、高质量的发展。

  • 标签: 数据挖掘 开放教育 流失分析
  • 简介:应用spssclementine数据挖掘工具构建logistic模型来预测潜在目标用户购买通信产品的概率,通过模型预测结果对购买通信产品概率比较高的用户进行产品推销,提高营销准确率,从而实现产品从粗放式营销到精确化营销,以节省通信企业投入成本,提高通信企业运营效益.

  • 标签: 数据挖掘 LOGISTIC模型 精确营销
  • 简介:摘要信息时代的到来,给人们带来了很多方便,与此同时,过多的复杂的信息本身也存在着相应的隐患。第一是信息过多难以消化理解;第二是信息真假难以分辨;第三是信息的错综复杂使得安全难以保证;第四是信息形式不一致难以统一处理。另一方面,随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多,增加的数据背后隐藏着许多重要的信息,如何将这些信息合理地利用起来为大家更好地服务,是一个值得研究的课题。

  • 标签: 数据挖掘高职教学评估
  • 简介:介绍了基于得克萨斯北部巴尼特页岩区带水平井中钻井、水力压裂处理和生产数据挖掘分析结果。文中对巴尼特页岩区带内13400多口生产井的钻井资料和生产资料进行了剖析。并对其中3300多口水平井的井筒结构进行了详细描述,描述内容包括井斜方位、斜角、水平段长度和射孔等。本研究利用了地理信息系统模式识别技术,并结合运用了常规统计技术,从看似分散的数据集中发现了隐藏的规律性。该项研究提供了一个实例研究,说明了如何利用数据挖掘技术解决页岩气藏最佳开发实践的问题。过去几年间,公开的钻井和生产井资料大量增加,为该项技术的应用创作了条件。简单地绘制生产数据与生产井变量及压裂变量的交汇图,所得结果往往较为分散。本次研究充分利用了页岩气大开发所产生的丰富钻井和生产数据,通过深入分析总结经验教训。文中论述了相关的一些变化趋势,诸如井筒趾端的走向(向下、水平或向上)、水平井段的长度、斜角等参数的变化对页岩气产量的影响。研究结果表明,把实用的数据挖掘技术应用于大型页岩气数据集,可以发现一些具有规律性的经验教训,而在小型页岩气数据集中应用这些技术可能发现不了这些规律性。这项研究的另一个突出特点是利用了汇总的储层物性近似值、井筒结构数据、完井资料和压裂处理数据,从地理的地角度绘制这些数据与生产数据的交汇图,提高数据解释的质量。

  • 标签: 数据挖掘技术 页岩气 得克萨斯 开发 模式识别技术 地理信息系统
  • 简介:目前,第三方测试服务由于其特有的独立性、公平性在软件行业的质量保证环节,占据了越来越重要的地位。第三方测试服务机构通过大量的测试服务积累了海量数据的测试缺陷库.但是如何利用第三方测试缺陷库庞大的测试缺陷数据更好地服务于被测厂商.提高我国软件行业的质量还处于空白。本文通过分析第三方测试缺陷库特征,结合数据挖掘中的关联分析和聚类分析算法对测试缺陷库中的缺陷进行了分析.通过分析结果能够更有效地提高测试效率,保证测试的可靠性、提高被测软件质量。

  • 标签: 第三方测试缺陷库 关联分析 关联分析 数据挖据
  • 简介:

  • 标签: