简介:网页去重是提高网络检索效果的有效途径。针对现有网页去重算法的不足和网页正文的结构特征,提出一个基于网页正文逻辑段落和长句提取的网页去重算法。该方法通过用户检索关键词将网页正文物理段落结构表示成逻辑段落,在此基础上提取逻辑段落中的长句作为网页特征码实现相似网页判断。实验证明,该方法提高了篇幅短小的镜像网页和近似镜像网页的去重效果。
简介:根据作者在工作中的体会,对连续出版物CNMARC格式中的“4--”字段所表示的各类相关关系进行了分析并举例加以说明。
简介:我国图书馆出版物缴送情报源缺失,出版物资源流失严重。网络环境下的出版物缴送情报源可分为主体类型、书目类型、载体类型。图书馆界应尽快采取有效措施,积极建设出版物缴送情报源。
简介:本文介绍了中外政府出版物中有关经济文献的类型、特点及其检索利用的工具。
简介:中华人民共和国国家标准《连续出版物著录规则(GB3792.3-85),以下简称《规则》)发布据今已有10个年头了。在这10年中,《规则》对规范期刊的著录,促进期刊工作标准化起了极大的推动作用,为当今迅速发展的计算机网络化打下了坚实的基础。但
简介:北京图书馆于1926年开始承担国际出版品交换工作,同时开始系统收集中国政府出版物,依靠当时身处北洋政府首都的地缘优势,收集到了近千部中央及地方政府出版物。1929年北京图书馆与国立北平图书馆合并后,政府出版物采访编目工作全面展开,成绩显著。1937年抗日战争爆发,平馆南迁和北平沦陷对政府出版物收集整理带来极大影响,南下的国立北平图书馆开展了中日战事史料征集工作,收集到了大量的官方出版物。
简介:先有物.后有名.有物必有名。事物名称是人们认定一种事物和区分不同事物的语言标识,它多多少少地反映着事物的特性。有相当一些连续性出版物题名中含有文献类型名称,作为正题名的一部分,或者被纳入到题名内,用以向读者表明它的性质、内容范围等。
简介:以古代辨名正物的目录学方法分析为基础,阐述图书馆员职业素养中的客观态度、主体介入、综合能力、职业规范和职业情感五大特征,证明古代文化对现代社会进步的启迪意义。
简介:介绍《近三百年人物年谱知见录》的撰写过程和撰写特色。
简介:本文以中山大学图书馆中西日俄文期刊回溯建库为例,从自动化系统、MARC数据资源、书目标准、馆藏标准、加工标准、质量监控、人员素质等方面论述了实践经验。
基于网页正文逻辑段落和长句提取的网页去重算法
略论连续出版物CNMARC格式中的“4——”字段
出版物缴送情报源的开发与利用
政府出版物中的经济文献信息及其检索利用
对《连续出版物著录规则》的若干意见
“国立北平图书馆”对政府出版物的收集整理
国内外连续性出版物题名中文献类型名称调研
“辨名正物”对图书馆员职业素养的五大启迪
学术考辨与目录索引相融合的开拓之作——小议《近三百年人物年谱知见录》
中西日俄文连续出版物回溯建库经验谈——以广州中山大学图书馆为例