简介:目前大多数自动标引方法不能有效利用文本中包含的多个特征。而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取。同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量。为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引。实验结果表明,基于集成学习方法的自动标引能提高标引结果的查准率和召回率。另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果。
简介:从1984年起,广西大学古籍整理研究室(后改为研究所)开始编制《古今图书集成索引》。经过二十多年的努力,取得了油印本、印刷本、电子版、网络版等阶段性成果。
简介:一、研究成果的主要内容本项目的成果是电子版《古今图书集成索引》2.0版,刻在一张CD—ROM上。
简介:阐述清初谭吉璁与《肃松录》、《丛书集成三编》与《肃松录》和《嘉兴谭氏遗书》与《肃松录》的内在联系,对难见《肃松录》原本的原因进行推断。
简介:在梳理政府信息服务中大数据应用研究现状的基础上,指出我国政府信息服务对大数据的应用还处于起步阶段,且面临着科层制政府的意识困境、大数据分析的实现困境、大数据应用的伦理困境以及个性化与公共性的争议困境等问题.提出从数据层、技术层、应用层三个层面来改进大数据应用,完善政府大数据应用的规则体系和运行机制,以提升基于大数据的政府信息服务水平.
简介:文章分析了数据库备份的重要性,介绍了两种自动备份SQLServer数据库的方法,并提供了两种异机存放备份文件的具体方案。
简介:对政府信息公开中大学生个人信息保护意识进行问卷调查,了解大学生对政府信息公开和个人信息保护问题的认识,了解大学生在个人信息保护方面遇到的问题、处理情况及对个人信息保护的满意程度,进一步分析指出应重视教育和宣传、培养大学生个人信息保护意识,并从国家、政府和个人三个层面提出相关建议。
简介:“中华字库”工程,是引领中华文化步入信息化、数字化时代,提高中国文化“软实力”的一项重要举措,有着重大的战略意义。是中华民族有史以来规模最大的汉字及少数民族文字整理工作。
简介:通过整理我国公共图书馆事业在1949年以来规模变迁的事实材料,尝试探讨该项事业相关规模指标与我国同时期国内生产总值(GDP)的相关性,分析经济发展与公共图书馆事业变迁的协同关系,探索宏观图书馆学研究的新领域,为未来我国公共图书馆事业的发展提供借鉴。
基于集成学习的自动标引方法研究
《古今图书集成索引》网络版推出
电子版《古今图书集成索引》2.0版简介
《丛书集成三编》之《肃松录》版本举正
我国政府信息服务中大数据应用的困境与对策
图书馆集成系统数据库的自动备份与异机备份
政府信息公开中大学生个人信息保护意识的调查研究
“中华字库”工程——中华民族有史以来规模最大的汉字及少数民族文字整理工作
我国公共图书馆事业变迁与经济发展的相关性研究——以规模变迁为例