国家知识产权局专利局专利审查协作湖北中心,湖北省武汉市 430000
摘要:S系统中的智能辅助检索系统能够进行智能语义检索排序,是我局近年来推出的重要专利检索系统,该系统以语义检索特点,对所推选出的语义检索结果进行相关度排序筛查,并且在语义检索的基础上,可以进行分类号和关键词的干预。本文根据智能辅助检索系统中的文本检索和干预检索,结合实际案例的检索过程,探讨了智能辅助检索系统的检索应用,以及检索中进行人工干预的检索策略。
关键词:S系统 专利检索 检索策略 自动检索 干预检索
引言
近年来,随着我国创新能力和创新水平的不断提高,我国专利申请量保持着快速增长的态势。对于智能化。智能辅助检索系统是我局基于S系统进行的智能化改造项目,系统对专利检索指导手册以及S系统上线十年来积累的宝贵审查经验数据进行了挖掘、应用。目前系统提供智能信息推送、导引检索、智能检索、自动检索和相似度浏览五大功能,实现了S系统从传统检索模式向智能化检索模式的转变。
二、自动检索简介
在当前的审查环境要求下,我局自动化部推出了智能辅助检索系统的自动检索,该系统中可通过案卷号、自由文本(用户提供的文字段落)、关键词(加权)、分类号(过滤),由系统按照预制算法进行目标文献检索,直接为用户提供检索结果集。自动检索在领域扩展、分类号扩展、关键词扩展等方面可以给审查员提供新的检索思路。
三、文本检索中干预检索的检索适用性
对于分类号、关键词准确,但涉及文限量巨大,且仅通过“分类号+关键词”或“关键词+关键词”组合的方式又难以准确概括出发明构思的申请,常规检索过程中将出现很多杂音,难以消除,很难通过人工浏览获取合适的对比文件,效率低下。审查员在充分理解本申请的基础下,准确掌握发明构思,可适用于采用S系统智能辅助检索中的干预检索,选取合适的关键词和大类/小类分类号,通过关键词(加权)和分类号(过滤)结合,可以快速命中对比文件,大大提升检索效率。
案例1(申请号201710449209X):1.一种医学图像中感兴趣区域的分割的方法,所述方法包括:
接收包含有感兴趣区域信息的医学图像;
确定第一预设条件;
基于所述第一预设条件识别所述图像中的所述感兴趣区域中的第一感兴趣区域;
分割所述第一感兴趣区域;
基于所述第一感兴趣区域确定第二预设条件;
基于所述第二预设条件识别所述图像中的第二感兴趣区域;
分割所述第二感兴趣区域。
(1)检索
1.1常规检索及检索难点
首先,本申请从权利要求1中可提取的关键词准确,但较为抽象,将会引入较多噪声,相关关键词为:医学,图像,肿瘤,分割,第一,第二,感兴趣,区域,条件。分类号G06T7/11涉及图像分割,分类准确,但文献量巨大,通过“分类号+关键词”或“关键词+关键词”的方式均不能准确反映出本申请的发明构思。
初步检索:
1 CNABS 111 (((第一 or 第二) 2w 区域) s 分割) and 条件
2 CNABS 103 (((第一 or 第二) s 区域) ) and ( ( 第一 or 第二) s 条件 ) and g06t7/11/ic
通过浏览分析发现,检索到的文献中都没有设置由第一预设条件分割第一感兴趣区域,基于第一感兴趣区域确定第二预设条件,基于第二预设条件分割出第二感兴趣区域的技术方案。
其次,考虑结合从权重进一步的发明构思来寻找对比文件。
权利要求3中进一步限定“对所述第一感兴趣区域的所述数据进行统计分析确定所述第二预设条件”。
权利要求4中进一步限定“所述第一预设条件和所述第二预设条件由与图像相关的参数、与所述参数相关的第一阈值或数值范围确定”。
权利要求5中进一步限定“所述与图像相关的参数包括像素值、体素值、分布均匀性或分布区域面积。”。
可提取关键词为:统计,体素,像素,分布,面积,阈值。
3 CNABS 90 ( ( 体素 or 像素 or 分布 or 面积 or 统计) 5d 条件 ) and 阈值 and g06t7/11/ic
浏览文献发现,上述关键词仍然难以准确锁定与本申请的技术方案相似的文献,检索结果中包含大量与本申请技术方案不相关的噪声文献。因此,本案技术方案的表达采用常规的分类号加关键词的检索模式存在困难。
1.2干预检索
在关键词不容易准确表达发明构思且难以扩展时,可考虑采用语义检索。从S系统中进入,对自动检索中推送的案件进行浏览,未发现可用的对比文件。尝试采用干预检索,用关键词加权和分类号过滤结合进行语义检索。
直接采用从权中出现的下位关键词进行干预。关键词(加权):统计,像素,体素,分布,面积。
直接采用本申请中IC分类号所在的小类进行过滤。分类号(过滤):
G06T7。
经过干预检索后,在文献列表中,序号第1位快速命中公开发明构思的对比文件1:CN106611413A ,显示与本申请的相似度为96%。
对比文件1的关键词分析:从详栏中查看该文件,发现干预检索的关键词除“统计”外,在全文中均有出现,且以下关键词在对比文件1中的作用与在本申请中的作用相同。
“像素”、“体素”:基于所述概率图中的每个体素或像素,确定所述海森点增强图中的对应体素或像素;
“分布”:由于结节的体素或像素和背景的体素或像素服从于高斯分布,本实施例采用高斯混合模型处理所述目标区域,用以获取所述目标区域的概率图,用于判定目标区域中各个体素是否为结节;
“面积”:所述目标区域可以通过外接矩形框显示,所述目标区域的外接矩形框的面积可以小于所述定位区域的外接矩形框,使得所述目标区域的外接矩形框进一步贴合结节区域,有效提高后续结节分割的运行速度。
对比文件1的分类号分析:其涉及的分类号“G06T7/11”中与本申请有交叉,其主分类号为“G06T7/00”与本申请不同,此外还给出了有关阈值分割“G06T7/136”、前景背景分割“G06T7/194”的分类号,均涉及类“G06T7”,与本申请相同。
此外,针对关键词“统计”,文献列表中也有出现相应的文献,序号第3位快速命中公开发明构思的对比文件2:CN104484871A ,显示与本申请的相似度为92%。
对比文件2的关键词分析:从详栏中查看该文件,发现干预检索的关键词出现“统计”,且关键词在对比文件1中的作用与在本申请中的作用相同。
对比文件2的分类号分析:其主分类号为“G06T7/00”与本申请不同,但涉及类“G06T7”与本申请相同。
该对比文件1、2若以常规检索的方式,难以快速锁定,采用干预检索语义检索方法快速命中,大大提升检索效率。
五、结语
本文介绍了S系统中的智能辅助系统,并通过实际检索案例,介绍了智能辅助检索系统在专利检索方面的一些心得。针对难以采用分类号、关键词概括出发明构思进行常规检索的案例,根据智能辅助检索系统的特定,结合简单有效的人工干预手段,能够快捷地获取相关的专利文献。
采用智能辅助系统,可实现自动和半自动检索协助审查员进行高效检索,充分发掘审查员智慧,提高审查效率,降低人力成本,由此提高审查系统的智能化应用水平。
参考文献
[1] 郭嘉,史凯. 浅析在patentics检索系统中的专利检索应用 [J]. 发明与革新,2017(8):123-127.