学科分类
/ 25
500 个结果
  • 简介:借助K-means算法等数据挖掘技术,从我国博士研究生招生实际状况入手,从博士招生的结构质量、生源质量和选拔质量等角度分析研究生招生质量,提出科学合理的优化选拔方式、提升生源质量的博士生招生方案,对博士研究生招生单位具有良好的借鉴意义。

  • 标签: 博士 招生 质量 聚类技术
  • 简介:本文针对目前基于算法的入侵检测技术存在符号类型数据处理能力欠缺、误报率较高的问题。提出了一种基于和关联规则修正的入侵检测技术。该方法将关联规则挖掘技术引入到聚类分析机制中.利用针对符号型属性的关联规则挖掘结果对结果进行修正,从而有效降低由于在入侵检测单纯使用聚类分析所导致的误报。文中详细的阐述了改进的具体实现方案,并通过实验验证了该技术的可行性。

  • 标签: 入侵检测 模糊聚类 关联规则
  • 简介:影响矿井煤炭自燃的因素包括煤炭自燃倾向性、地质条件、开采技术条件,煤炭自燃预测是一个模糊系统。应用模糊聚类分析法,将一定数量煤矿自燃信息作为样本进行聚类分析,可以得到煤层自燃危险程度模式,预测待开采煤层的自燃危险程度。

  • 标签: 煤炭自燃 预测 模糊聚类法
  • 简介:云计算中的群集计算应用程序(例如MapReduce和面向用户的应用程序)具有应用程序级别的需求,因此需要有高级别的抽象来表示这些应用程序的需求.协流(coflow)是一个网络级别的抽象,用来表达数据并行编程范例的通信要求.协流使应用程序更容易地将其通信语义传达给网络,从而使网络能够优化常见的通信模式.然而,现有的协流识别方案依赖于修改应用程序,并不适用于多数实际场景.提出了基于增量的协流识别策略,采用增量算法来执行快速、透明的协流识别,实现了协流识别的自动化,同时无需对应用进行修改.仿真实验结果显示,本文的识别算法具有超过90%的准确率,具有一定的鲁棒性.

  • 标签: 数据中心网络 协流 增量聚类
  • 简介:k均值算法是一个常用的局部搜索算法,它的主要缺陷是容易陷入局部极小,并且该局部极小解与全局最优解往往有很大的偏差.本文提出一个基于K-均值的迭代局部搜索文档算法.该算法以k均值算法所得到的解作为初始解,从该初始解开始作局部搜索,在搜索过程中接受部分劣解.当解无法改进时,算法对所得到的局部极小解做适当强度的扰动后进行下一次的迭代,以跳出局部极小,从而拓展了搜索的范围.实验结果表明该算法对文档数据集聚的正确性达99%以上.

  • 标签: K-均值 迭代局部搜索文档聚类算法 局部极小解 全局最优解 数据库
  • 简介:传统的搜索引擎所提供的搜索结果仅仅是按照Web与查询的相关性从高到低排成一个有序列表,不具备层次性。用户使用起来并不方便。文章通过采用覆盖算法对搜索引擎的结果进行来解决这个问题,并对其实现过程进行较为详细的描述。

  • 标签: WEB 信息检索 搜索引擎 覆盖聚类算法
  • 简介:摘要分析了C油田A二油层驱注后期含水回升期存在的主要问题,即聚合物突破后,层间矛盾加剧,薄差层动用程度差,加之聚合物的清污混注,使区块含水上升过快,目前综合含水达到94.8%,并制订实施综合调整措施,含水回升速度得到控制,区块开发效果明显改善。

  • 标签: 二类油层 注聚后期 含水上升
  • 简介:学生工作是项复杂的工作。随着媒体时代的到来,高校学生的思想受多元网络信息的影响也日渐呈现多样化,学生思想政治教育工作也相应呈现出一定的不可控性,工作难度也相应增大。特别是对于艺术学生学生而言,他们思想活跃、易于感性处事,易受真假难辨的网络媒体信息影响。在媒体时代,做好艺术类专业学生的思想政治教育工作是高校思想政治教育工作者亟需解决的课题。

  • 标签: 自媒体 学生工作 艺术专业 思想政治教育
  • 简介:采用模糊思想与方法,对大学生体质健康测试数据进行分析,从庞杂的数据中获取有价值的信息,建立学生体质健康状况评价模块,用以帮助教师及学生更好的了解学生的体质状态,选择锻炼方法,提高学生健康质量。本文以5000名在校大学生的体质健康测试数据为案例,应用模糊方法对数据进行处理分析,得到了各类的语意解释,从而量化的评价了学生体质健康情况。

  • 标签: 体质健康 模糊聚类
  • 简介:通过研究视频汉字识别问题,提出了关于视频中汉字跟踪及分割算法。首先,提取视频样本特征,采用K均值算法进行作为第1次分类,之后,采用多个BP(backpropagation)神经网络进一步细分一次分类后的结果作为二次分类。最后,对以上算法进行了实验验证,结果证明这些算法是有效的,多层分类器较单一的BP神经网络分类器识别率更高。

  • 标签: 汉字分割 汉字跟踪 K均值聚类 BP神经网络
  • 简介:以《中国期刊全文数据库》核心期刊中有关“大学文化”研究的论文作为原始数据源,使用CiteSpaceII软件绘制时间线图,以研究主题为标签词标示文献,析出凸显主题;在数据统计的基础上,参照引用频次、徒增性和高中心性等指标选择若干关键词,并对其阐释分析;阅读每一的所属文献,把析出的研究主题词通过逻辑图的形式加以呈现,并形象解读;进而加深对大学文化相关研究的理解,深刻反思大学所肩负的神圣使命。

  • 标签: 大学文化 大学使命 研究主题 可视化 反思
  • 简介:针对Hadoop存在的不足,提出了利用分布式数据库来模拟共享存储空间的解决方案。并对DBIK-means算法做了并行化设计和实验分析,验证了DBIK-means算法在处理大数据时,能够获得较好的加速比。

  • 标签: HADOOP DBIK-means聚类算法 并行化
  • 简介:针对高职生职业能力测评,提出由5个方面23个细项组成的测评体系,采用了模糊算法实现对高职学生职业能力进行客观分类,给企业招聘毕业生和学院教学质量分析提供重要的参考。

  • 标签: 模糊聚类分析 职业能力测评 高职学生
  • 简介:非参数认知诊断方法只需Q矩阵,无须估计参数等优势,使其近年来备受关注,但其判准率如何,哪些因素会影响判准率,并未有相关研究。本文通过模拟研究,探讨属性个数、样本容量和属性层级结构对该方法判准率的影响,结果表明:①属性个数的增加会导致判准率的下降,但其稳健性较参数模型要好;②属性间逻辑关系的紧密度会对判准率产生影响,但其表现形式与参数模型不同;③样本容量对判准率影响很小,属性个数较少时100人已足够,随着属性个数的增加,500人的样本已是较佳样本。本研究为CDA走向小型测评及课堂评估提供了参考信息。

  • 标签: 非参数认知诊断 K-means方法 属性个数 样本容量 属性层级结构
  • 简介:为实现高校教师有效教学的特征识别,以问卷的形式对高校教师教学能力现状的反馈情况进行考查和归纳,提取教学意识能力、教学风格能力、教学认知能力、教学反思能力等7个有效教学特征因子,并采用李克特五级量表进行数据处理。提取有效教学的特征值,对有效教学特征因子进行量化,得到有效的教学特征数据,进而采用模糊C均值算法对有效教学特征数据进行分类,建立标准有效教学模型库。将新的教师有效教学特征值通过模糊模式识别中贴近度的方法与模型库相匹配。如果不匹配,提出4种提升有效教学的策略,为后续的教学风格研究提供依据。

  • 标签: 模糊聚类 有效教学 特征因子
  • 简介:摘要:德语是德国的官方语言,也是欧盟境内使用人数最多的母语,全世界约有2亿人使用德语进行交流,庞大的德语使用人群贡献了不计其数的德语数字化文本信息。与汉语、英语等语言相比,目前国内外对德语文本挖掘的研究较少,还远未成熟,准确性不令人满意。其中,德语文本研究仍处于起步阶段,目前尚未见国内外有系统的德语文本方法研究,而当前较为成熟的汉语和英语文本方法无法直接应用于德语文本

  • 标签: 特征词配对 德语 文本聚类方法
  • 简介:摘要:以B站为代表的一视频网站提供了大量优质知识视频,将其作为教学的辅助资料可以有效改善现场教学和传统公开课的时空限制以及缺乏趣味性等问题;而其独特的弹幕互动和高饱和信息量也是传统教学很难达到的。但是媒体平台也缺少传统课堂教学适配于专业课程学习与研究的必要特质,即系统性和深入性。因此,高校师生既不能忽视这些网络资源的价值,更需要对其进行甄别与合理利用。

  • 标签: 自媒体 外国文学 教学 B站
  • 简介:健康是人的第一追求,合理的营养摄入是健康的根本保障,蔬菜在日常饮食和营养健康方面占有重要地位。通过分析不同品种蔬菜的营养组成部分,以蔬菜营养组成成分为依据,对常见蔬菜品种进行聚类分析;同时,考虑到价格因素和居民营养需求,运用目标规划,确定比较适当的居民人均蔬菜消费参考量,为人们改善营养状况和身体健康提供依据。

  • 标签: 蔬菜 目标规划 人均消费
  • 简介:摘要本文以广西桂林市漓江景区和阳朔西街景区附近403家酒店作为研究对象,运用K-Mean聚类分析,分别从酒店的用户体验、服务环境、酒店价格和酒店规模四个总体指标对酒店的类型进行综合评价。研究发现,分类状况和美团网上酒店标记类型基本一致,表明广西桂林市漓江和阳朔西街景区的酒店整体运营与服务环境以及用户体验大体上使人满意,以及应用K-Maens聚类分析对酒店的综合评价具有可行性。

  • 标签: K-Mean聚类 酒店类型 综合评价
  • 简介:针对半监督算法易受噪点的影响,提出一种基于数据清洗的改进半监督算法DCSC。将噪点从数据集中提取出来另行分析。从数据清洗处理后的数据集中抽取若干正常与异常样本分别计算作为初始样本辅助K-Means算法进行。实验结果表明,与现有相关算法相比,该算法具有检测未知攻击的能力,且具有更高的攻击检测率以及更低的误报率。

  • 标签: 数据清洗 半监督聚类 入侵检测