学科分类
/ 2
28 个结果
  • 简介:本文叙述了目前人们可以通过网络数据库实现全文检索的情况下,自动标引的重要性,它可以针对海量信息进行检索和挖掘,可以把人类的思维同计算机技术相结合,使检索信息更完整、全面。

  • 标签: 中文数据库 索引 自动标引
  • 简介:中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。作者比较了两种分类主题词表的编制模式,讨论了机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。文章最后还分析了将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。

  • 标签: 中国分类主题词表 中国图书馆分类法 分类主题词表 计算机辅助编制 知识库 自动分类
  • 简介:古代农业专题资料自动编纂是利用计算机自动从古代农业专题资料中发现并摘录与某一主题相关的农业资料,并编纂成册。本文首先阐述了古代农业专题资料自动编纂的意义,接着比较了它和自动文摘的关系,然后就其自动编纂的流程和算法进行了设计,最后总结本文的写作目的。

  • 标签: 古代农业专题资料 自动编纂 自动文摘 自动分词 篇章分割
  • 简介:由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。

  • 标签: 《中国图书馆分类法》 分类矩阵 自动分类
  • 简介:电子政务主题词表是电子政务信息的组织和检索的重要语义工具。传统手工编制叙词表的方法耗费大量人力、物力,成本高、历时长,已不再适用于网络环境。本文拟以共青团电子政务词表为例,探讨用计算机自动构建叙词表的方法。主要技术要点包括:利用N-gram方法进行选词、结合Dice测度、相似度算法、模式匹配等多种技术来自动识别词汇的等同、等级和相关关系。最后评测了自动构建的电子政务主题词表的性能。

  • 标签: 电子政务 叙词表 词表自动构建 词间关系识别 N—gram方法
  • 简介:分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。本文详细讨论了该知识库的构建原理、结构、编制使用的关键技术以及主要应用等。

  • 标签: 《中国图书馆分类法》《中国分类主题词表》知识库 知识组织系统 自动标引 自动分类 中文文献数据库 信息自动分类
  • 简介:为了提高索引编制的效率与质量,利用计算机技术实现古籍目录索引自动编制,其重要性、必要性不言而喻。“中华古籍索引库”在古籍目录索引自动编制方面作出了有益的探索和实践。本文以“中华古籍索引库”为例,介绍索引编制过程中,索引条目抽取、编排等环节的工作思路及经验。

  • 标签: 中华古籍索引库 古籍目录索引 自动编制
  • 简介:文章分析了数据库备份的重要性,介绍了两种自动备份SQLServer数据库的方法,并提供了两种异机存放备份文件的具体方案。

  • 标签: 图书馆 数据库 自动备份