论文查询检索-中国期刊网

学科分类

文化科学
文化科学

年份：

不限 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 更早

最新浏览↓

共 5 个结果

基于机器学习的专利文本分类算法研究综述

作者：刘红光;马双刚;刘桂锋
学科：文化科学 > 情报学
创建时间：2016-03-13
出处：《图书情报研究》 2016年第3期

简介：总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的-般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程.将应用于专利文本分类的机器学习算法分为单-分类算法和组合分类算法着重探讨单-分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法.指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.
标签：专利文本自动分类机器学习朴素贝叶斯支持向量机

全文阅读

融合热门度因子基于标签的个性化图书推荐算法

作者：徐文青;双林平
学科：文化科学 > 情报学
创建时间：2015-03-13
出处：《图书情报研究》 2015年第3期

简介：依照Web2．0的“社会化标注”思想，针对基于内容的推荐算法（cBR）和协同过滤推荐算法（CF）存在的不足，提出了基于读者标签（Tags）的、融合图书“热门度”因子的个性化图书推荐的两个改进算法。利用统计分析软件R，重点对改进后的CBR算法进行实验分析和验证，结果表明，改进算法的图书个性化推荐效果有明显改善。
标签：图书个性化服务推荐算法标签热门度

全文阅读

基于网页正文逻辑段落和长句提取的网页去重算法

作者：张小娣;宋余庆
学科：文化科学 > 情报学
创建时间：2012-02-12
出处：《图书情报研究》 2012年第2期

简介：网页去重是提高网络检索效果的有效途径。针对现有网页去重算法的不足和网页正文的结构特征，提出一个基于网页正文逻辑段落和长句提取的网页去重算法。该方法通过用户检索关键词将网页正文物理段落结构表示成逻辑段落，在此基础上提取逻辑段落中的长句作为网页特征码实现相似网页判断。实验证明，该方法提高了篇幅短小的镜像网页和近似镜像网页的去重效果。
标签：网页去重逻辑段落长句提取句子相似度

全文阅读

一个基于特征向量的近似网页去重算法

作者：曹玉娟;牛振东;彭学平;江鹏
学科：文化科学 > 情报学
创建时间：2009-01-11
出处：《中国索引》 2009年第1期

简介：在搜索引擎的检索结果页面中，用户经常会得到内容相似的重复页面，它们中大多是由于网站之间转载造成的。为提高检索效率和用户满意度，提出一种基于特征向量的大规模中文近似网页检测算法DDW（Detectnear—DuplicateWebPages）。试验证明，比起其他网页去重算法（I—Match），DDW具有很好的抵抗噪声的能力及近似线性的时间和空间复杂度，在大规模实验中获得良好测试结果。
标签：网页去重算法特征向量近似网页支持向量机

全文阅读

计算机、扫描仪替代缩微阅读机的一套方案

作者：廖晴川
学科：文化科学 > 情报学
创建时间：2003-01-11
出处：《图书情报论坛》 2003年第1期

简介：目前中、小型图书馆拥有的缩微胶卷不多,但有不少馆又购有一定量的缩微胶卷,特别是有关本地方的文献资料,如果缺藏,向全国缩微中心购买,不失为收集地方文献的一条最便捷的途径。如民国时期的《柳州日报》在本市甚至本区都已经散失不存。我馆以能接受的价钱,向全国缩微中心购得一批民国版的《柳州日报》(1938—1949,共14卷),是研究民国时期的柳州的
标签：计算机扫描仪缩微阅读机替代方案缩微资料工作缩微胶卷

全文阅读

返回顶部