学科分类
/ 1
8 个结果
  • 简介:船舶自动识别系统(AIS)数据具有海量性、时空性和小记录频繁更新等特性。面向海量AIS数据,提出了一种基于分布式集群的AIS数据存储方法。该方法对AIS数据存储索引结构进行了设计,通过对时间维按月切分,以及对空间范围聚类切分,构造了索引时空立方体,从而提升了时空查询效率。讨论了索引分片和副本设计与数据安全性和系统服务可靠性的关系,分析了时空立方体性能,并针对索引分片与副本数对索引性能的影响,进行了理论分析和试验验证。

  • 标签: 时空索引 船舶自动识别系统 轨迹压缩 数据集群
  • 简介:相似文档搜索指检索与给定查询文档相似的文档,在大数据处理中具有广泛的应用,如近似网页检测、新闻报道聚合以及抄袭检测等。为实现海量相似文档的快速搜索,可采用Simhash指纹方法将文档映射成二进制指纹,以海明距离表达文档相似度,并通过指纹分段建立索引提高计算效率。针对传统方法在指纹分段过程中大量冗余计算影响到计算效率的问题,提出了基于顺序匹配的候选集筛选方法,以减少指纹相似性计算量和网络带宽消耗,实现快速搜索。试验表明,该方法具有较好的性能和可扩展性。

  • 标签: Simhash方法 相似文档搜索 顺序匹配
  • 简介:海量实时数据的存储访问是实时报文存储处理系统存储性能的瓶颈。分析了实时报文的应用场景;构建了实时报文数据访问的时间耗费模型,探讨了系统的主要时间耗费因素;提出了分区存储、批量存取和分页查询三种数据存储访问策略;编程实现了报文数据访问引擎,运用线性回归方法拟合了数据的保存速率。验证表明,该引擎具有高效性、资源占有率低、伸缩性强和稳定可靠的特点。

  • 标签: 报文存储访问 存储性能 分区存储 批量存取 分页查询
  • 简介:套用车牌是一种侵犯车主利益的交通违法行为,识别套牌车将有助于公安机关进行交通和车辆管理。鉴于现有套牌车算法无法适应海量卡口行车数据统计,提出了一种基于海量数据统计的定向套牌车检测算法。试验结果表明,该算法有效降低了套牌车计算量,提高了套牌车检出率。

  • 标签: 大数据 卡口行车数据 套牌车检测
  • 简介:摘要当前,互联网用户规模不断扩大,这些都与互联网的快速发展有关。现在传统的数据库已经不能满足用户的需求了。随着云计算技术的飞速发展,我国海量数据快速增长,数据量年均增速超过50%,预计到2020年,数据总量全球占比将达到20%,成为数据量最大、数据类型最丰富的国家之一。采用分布式数据库可以显著提高系统的可靠性和处理效率,同时也可以提高用户的访问速度和可用性。本文主要介绍了分布式数据库的探索与研究。

  • 标签: 海量数据 数据库系统
  • 简介:摘要对孩子的教育培养牵动着每一个父母的心弦。家长片面的追求孩子识字量的多少、数字能数到多少,以识字数量的多少来衡量孩子的聪明与否,将识字,认数同唱歌、跳舞、绘画、阅读等学习内容分割开来,使得对孩子的早期教育出现了许多误区。本文就幼儿早期识字阅读常见的误区及对策进行探究,以期为幼儿早期识字阅读提供参考。

  • 标签: 幼儿识字阅读 常见误区 对策研究
  • 简介:摘要读书识字是我国最基础的教育内容,也是让小学生能够打好语文学习基础的教学关键点,同样使得小学生能够掌握并熟练地进行文字识别记忆也是对其整个小学语文教学阶段来说有着重要的意义。因此本文对小学语文课堂中的识字教学中的问题与现状进行研究,并针对性地提出相应的教学策略。

  • 标签: 小学语文 识字教学 教学策略研究