简介:摘要在遥感技术支持下,利用神经网络与模糊聚类结合方法对城市绿地生态环境服务价值的划分进行探讨,使用TM遥感影像提取城市绿地生态环境服务价值的各项影响因子,并运用自组织基本竞争神经网络对城市绿地生态服务价值的各项影响因子进行划分评判,采用最大树枝法对每个影响因子的评判结果进行模糊聚类分析,最终实现对城市绿地生态服务价值的综合评判。以广州研究区域为例,实验结果显示1等生态环境区域为白云山和火庐山等植被覆盖度高的林地。2等生态环境区域主要集中在白云山较为稀疏的林地和种植作物的农地。3等生态环境区域主要集中在果园用地。4等生态环境区域主要为草地。结果与实际情况相符,可见此方法可行。
简介:本文提出一种基于聚类的电网运行监控信息辨识分类方法,其特征在于,以大量的电网运行监控信息为基础,按照监控信息发出时间为依据进行分段,将原本连续的监控信息切分成多个文本,而后采用统计学的方法对文本进行预处理形成对应特征向量,并通过数据挖掘的方法对特征向量集合进行聚类分析得出聚类规则。最终实现对监控信息的自动辨识分类功能,辅助电网监控人员及时发现设备发出的告警信号,维护电网安全稳定运行的目的。
简介:摘要本文在将数值型数据标准化的基础上,将分类数据细分为二元数据和类型数据,并用相异度系数距离计算分类数据之间的距离,并且赋予二元和类型数据相应的权重,来改进k-prototypes聚类算法,使该算法满足不同要求的混合属性数据聚类,最后通过C#语言,在ArcEngine2010版本上实现。
简介:关系数据的聚类算法对于传播研究意义重大,首先运用迭代系统隐喻个体结构的变化,用输出与状态的包含距离表示关系的非对称同时也确定拥有最高结构等级序列的节点来代表簇;再将Hausdorff距离引入DBSCAN算法,使得同结构节点进行合并的加和算子和层次上卷的并算子变得可压缩。运用复杂网络研究人员的数据对算法的有效性进行了评估,分层后的人员合作网具有不同的网络结构特征;关键词在层次2网络中的传播效率高;互惠关系在知识传播中的作用最大。新的发现证明算法通过引入Hutchinson算子的可压缩测度Hausdorff距离使得网络结构对传播效果的影响得以体现,该算法的设计思路是正确的。
简介:不确定性是数据的固有属性,在实验过程中由于仪器的限制或者收集过程中的误差都会造成数据的不确定性。数据挖掘算法在处理不确定数据的相关研究尚处于初级阶段,不确定数据聚类是不确定数据研究中的典型问题,已有一些聚类算法被应用到处理不确定数据,如UK-means等。无论是UK-means还是FDBSCAN都仅仅考虑了不确定数据之间的几何距离,而没有考虑到不确定数据之间的概率分布差异。然而,概率分布特征是不确定数据的本质特征,考虑不确定数据的概率分布能够更准确度量不确定数据间的距离,从而提高聚类算法的性能,本文使用核函数度量不确定数据与类中心的距离,然后使用UK-means算法聚类不确定数据,通过大量实验验证了本文提出的距离函数优于使用欧式距离期望的UK-means方法。
简介:云计算中的群集计算应用程序(例如MapReduce和面向用户的应用程序)具有应用程序级别的需求,因此需要有高级别的抽象来表示这些应用程序的需求.协流(coflow)是一个网络级别的抽象,用来表达数据并行编程范例的通信要求.协流使应用程序更容易地将其通信语义传达给网络,从而使网络能够优化常见的通信模式.然而,现有的协流识别方案依赖于修改应用程序,并不适用于多数实际场景.提出了基于增量聚类的协流识别策略,采用增量聚类算法来执行快速、透明的协流识别,实现了协流识别的自动化,同时无需对应用进行修改.仿真实验结果显示,本文的识别算法具有超过90%的准确率,具有一定的鲁棒性.