学科分类
/ 1
9 个结果
  • 简介:目前大多数自动标引方法不能有效利用文本中包含的多个特征。而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取。同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量。为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引。实验结果表明,基于集成学习方法的自动标引能提高标引结果的查准率和召回率。另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果。

  • 标签: 自动标引 关键词提取 集成学习
  • 简介:阐述清初谭吉璁与《肃松录》、《丛书集成三编》与《肃松录》和《嘉兴谭氏遗书》与《肃松录》的内在联系,对难见《肃松录》原本的原因进行推断。

  • 标签: 丛书集成三编 肃松录 谭吉璁 谭新嘉 明帝陵
  • 简介:在梳理政府信息服务中大数据应用研究现状的基础上,指出我国政府信息服务对大数据的应用还处于起步阶段,且面临着科层制政府的意识困境、大数据分析的实现困境、大数据应用的伦理困境以及个性化与公共性的争议困境等问题.提出从数据层、技术层、应用层三个层面来改进大数据应用,完善政府大数据应用的规则体系和运行机制,以提升基于大数据的政府信息服务水平.

  • 标签: 政府信息服务 大数据 政府信息资源
  • 简介:文章分析了数据库备份的重要性,介绍了两种自动备份SQLServer数据库的方法,并提供了两种异机存放备份文件的具体方案。

  • 标签: 图书馆 数据库 自动备份
  • 简介:对政府信息公开中大学生个人信息保护意识进行问卷调查,了解大学生对政府信息公开和个人信息保护问题的认识,了解大学生在个人信息保护方面遇到的问题、处理情况及对个人信息保护的满意程度,进一步分析指出应重视教育和宣传、培养大学生个人信息保护意识,并从国家、政府和个人三个层面提出相关建议。

  • 标签: 政府信息公开 个人信息保护 大学生 调查研究
  • 简介:“中华字库”工程,是引领中华文化步入信息化、数字化时代,提高中国文化“软实力”的一项重要举措,有着重大的战略意义。是中华民族有史以来规模最大的汉字及少数民族文字整理工作。

  • 标签: 中华字库 中文数据库 文化建设
  • 简介:通过整理我国公共图书馆事业在1949年以来规模变迁的事实材料,尝试探讨该项事业相关规模指标与我国同时期国内生产总值(GDP)的相关性,分析经济发展与公共图书馆事业变迁的协同关系,探索宏观图书馆学研究的新领域,为未来我国公共图书馆事业的发展提供借鉴。

  • 标签: 公共图书馆 规模变迁 国内生产总值 相关性研究