简介:摘要:本文旨在通过k-means文本聚类了解国内大数据岗位需求特点,帮助企业和员工识别大数据人才,推动大数据相关研究的进一步发展。首先利用爬虫软件对招聘网“大数据”的招聘信息进行爬取招聘网站。然后利用解霸分词和K-means文本聚类对大数据招聘岗位进行聚类,聚类数由组内平均平方和确定。最后,将大数据岗位划分为10类,从整体数据集和聚类结果的角度对大数据岗位的城市分布、薪资水平、学历要求、经验要求等进行讨论和分析,明确大数据岗位的特点。大数据工作需求。分析结果表明,大数据的工作需求主要分布在一线城市和新一线城市。企业更倾向于大专或本科学历及一年以上相关工作经验的求职者。不同类型的工作之间存在工资差异。职位越高,对学历和经验的要求就越高。
简介:摘要:当前,交通拥堵问题已经成为世界范围内城市的议题。城市道路在信号交叉口处通行效率的高低尤为重要,而网联交通技术的出现为提高道路利用率与调控交通流行为提供了新的发展机遇。本文针对车联网环境下城市主次干道相交路口,基于车联网数据提出信号优化算法。根据交叉口上游的车辆到达,采用K-means聚类方法寻找绿时分配的自然断点来优化相位配时;在不同进口道的聚类簇集基础上,提出一种贪心的相位选择算法,既能保证交叉口能获得当前最大系统收益,又在一定程度上实现了公交优先。在VISSIM 中设计感应信号控制交叉口作为对照组,并实现了自适应控制交叉口的仿真实验。对比结果表明,模拟交叉口的平均延误与停车次数较感应控制明显降低,公交运行效率大幅提高。
简介:提出了一种新的多数据流聚类算法.该算法可以有效地对有相似行为但存在一定时间延迟的多数据流进行聚类.算法采用自回归模型技术度量数据流间的延迟相关,利用频谱估计来抽取数据流的特征.每一个数据流用其谱分量的和来表示,从而来计算每对数据流间的相关关系.每个谱分量用振幅、相位、衰减率、频率4个参数来描述.算法计算谱分量对之间的ε-延时相关关系,并以此为基础来得到聚类分析中数据流间距离的度量.此外,算法采用滑动窗口技术对多数据流进行聚类,实时地得出聚类结果且动态地调节聚类的个数.在人工数据集和实际数据集上的实验结果表明,所提出的算法比其他类似的算法具有更快的速度和更好的聚类效果.
简介:随着"创客"一词首次被写入2015年政府工作报告,创客运动席卷全国。创客教育作为创客运动的"衍生产品",以其创新性视角及"做中学"的理念而被大众所熟知。文章使用书目共现分析系统Bicomb2.0提取国内创客教育相关研究的高频关键词并进行词频分析,构建共词矩阵及词篇矩阵,利用社会网络分析工具NetDraw绘制高频词汇的国内创客教育共词网络图,使用SPSS统计分析工具进行关键词聚类分析和多维尺度分析,进而对国内创客教育研究的重要主题进行分析并提出国内创客教育面临校园创客教育"本土化"、创客教育理论体系及课程体系建设、创客教育优秀师资队伍培养、创客教育实施的评价指标体系构建四大挑战。
简介:摘要灰色聚类法是在绿色住宅建筑结构设计评价中常用的评价方法,对于完善绿色建筑评价体系有重要意义。本文首先对绿色住宅建筑的结构设计问题进行简单介绍,进而探讨灰色聚类法在绿色住宅结构设计评价中的应用,分析其权值计算方法和系数向量计算方法
简介:利用2015年11月至2016年10月辽宁14市环境空气质量监测数据和地面气象站点监测数据,对辽宁省细颗粒物污染时空特征以及气象因子对其影响规律进行了系统的分析,并据此进行聚类分区。结果表明:辽宁城市PM2.5浓度变化的季节性差异明显,呈冬季高、春季次、夏秋低的总体特征;辽宁全境PM2.5浓度的空间分布差异较大,中部平原地区为最高、两翼丘陵较低、东部沿海最低;根据PM2.5浓度与气象因子的散点图及Spearman相关系数,辽宁城市可分为4种类型,即辽东半岛型(I类,包括丹东、大连、盘锦、营口)、辽西山地型(II类,包括葫芦岛、锦州、朝阳、阜新)、辽东山地型(III类,包括本溪、抚顺)、辽中平原型(IV类,包括铁岭、沈阳、辽阳、鞍山),4类城市的PM2.5浓度依次递增,且冬季最为明显;PM2.5浓度与气温、水汽压、相对湿度仅在冬季均呈正相关,但I、II类城市在春季呈正相关,IV类城市在春、夏两季也呈正相关;与风速在冬季均呈负相关;与气压的相关性不明显。
简介:摘要院文章采用模糊聚类算法,根据顾客的月消费水平隶属度进行百货企业的市场细分,提出基于ABC控制法的顾客目标市场定位,为百货企业提供决策依据。
简介:摘要:为了精准有效地识别高速公路交通运行状态,基于重庆市高速公路ETC门架数据,选取交通流量、车辆速度、交通密度作为交通状态分类指标,将K-means聚类算法的聚类中心作为模糊C均值聚类算法的初始聚类中心,利用改进后的模糊C均值聚类算法构建高速公路交通状态识别模型,利用支持向量机分类模型(SVM)交叉估计法验证运行状态识别准确率。研究表明改进后FCM聚类数据比原始FCM聚类数据识别精准度提高了3.5%,改进后的FCM算法迭代次数少、目标函数值小、更精准有效地实现了高速公路交通运行状态的识别。
简介:摘要院经过了2012-2013年的爆发式增长之后,国内的APP市场开始逐渐回归理性,对APP的考评标准,也逐渐从用户数量大小(量评)向用户黏性高低(质评)转变。而在国内外的相关研究中,用户留存率和用户使用率是考量用户黏性高低的两个重要指标。本文尝试使用上述两个指标,从内容和体验两个维度探析提升健康类APP用户黏性的途径。