简介:由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。
简介:[目的/意义]全面揭示科学知识图谱理论与方法在我国社会科学领域的应用现状和特征。[方法/过程]以中文社会科学引文索引(CSSCI)中收录的653篇科学知识图谱的文献作为研究样本,通过CiteSpace等相关工具对社会科学领域知识图谱的应用趋势、高频施引与被引期刊、作者、研究热点的演化以及知识基础进行分析。[结果/结论]结果显示,自知识图谱方法被引入到我国以来,在社会科学领域增长迅速。知识图谱的作者、期刊以及核心文献主要集中在以图书情报和文献计量为主的领域中。知识图谱研究主题起点和核心仍然位于文献图谱的相关领域,近期在教育和大数据等领域应用较多。
简介:[目的/意义]对精细加工可能性模型(ELM)的研究现状及应用领域进行分析,探索ELM应用于图书情报领域的可能性.[方法/过程]以WebofScience核心数据集中的358篇ELM领域的论文作为研究对象,使用CiteSpace和VOSviewer知识图谱工具对ELM的研究前沿及其热点领域进行可视化呈现,并对该领域的经典文献进行梳理.以WebofScience和CNKI数据库中有代表性的期刊论文为分析对象,统计分析ELM的国内外主要应用领域.[结果/结论]研究发现,ELM目前主要应用在信息传播、商业广告、电子商务、网站设计等领域.认为未来的研究中,可以将ELM运用到图书情报领域中,如开展专利价值的评价与影响因素分析、专利的技术特性和法律特性分析等.
简介:[目的/意义]基于关键词分析,得出不同类型的微博阅读群体的特殊行为特征,分析微博对群体阅读所起的作用和用户参与中的得失。[方法/过程]通过采集微博热门读书话题的数据样本,进行关键词提取、关键词词频统计、关键词与微博热度相关性分析、关键词文本分类和情感分析。[结果/结论]对于在微博平台如何更好开展群体阅读分别从有影响力用户、普通用户、商业用户及平台方角度提出具体发展建议:有影响力的微博用户应加强与普通用户的深度互动;普通微博用户应加强自己的"深阅读"能力和交流能力;微博商业用户应减少书籍的过度营销;新媒体应加强对知识性阅读话题的重视和推广。