首页 > 《智能物联技术》 > 2019年1期 > PU场景下的生物医学命名实体识别算法研究

PU场景下的生物医学命名实体识别算法研究

在线阅读下载PDF 导出详情

摘要传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步法方法,将生物医学命名实体识别问题转化为PU场景下的命名实体识别问题。在第一步中分别使用1-DNF、Spy、NB和Rocchio算法在未标注数据中抽取强负例,然后在已有的正例数据和强负例数据的基础上构建隐马尔可夫模型,最后对待分类数据进行命名实体识别。在GENIA语料库上的实验结果显示,在标注数据较少的情况下,通过使用PU学习方法的两步法构建分类模型,其性能显著优于直接使用标注数据构建的分类模型,同时降低了人工标注数据的成本。

DOI rj8zrrl9j0/1975858

作者高冰涛;翟振刚;刘斌

机构地区不详

出处《智能物联技术》 2019年1期

关键词正例未标注学习隐马尔科夫模型命名实体识别文本挖掘

分类 [自动化与计算机技术][计算机系统结构]

出版日期 2019年01月11日（中国期刊网平台首次上网日期，不代表论文的发表时间）

相关文献

1李娟. 基于命名实体的网页推荐算法研究.教育学,2013-06.
2孙铭君, 辛欣（等同第一作者）. 命名实体识别技术专利技术分析.,2023-05.
3王学锋;杨若鹏;朱巍. 基于深度学习的军事命名实体识别方法.军事理论,2018-04.
4李博涵,向增润,刘宇,兰宇婷,刘维浣. 基于Bert-BiGRU-Self-attentionCRF的命名实体识别模型.教育学,2024-06.
5楠丁. 识别指名实体研究概况.少数民族语言,2015-03.
6慈颖1 ,李晓丽2 ,杨萍3 ,魏伟波4 ,高米5. 基于语法树重构的BERT命名实体识别方法技术.,2022-09.
7毛兰·买买提. 基于维汉机器翻译的维语命名实体的识别与翻译.课程与教学论,2018-12.
8周顺舜. 智慧司法中的法律文书命名实体研究.,2022-08.
9张宏生. 使用HMM模型改进规则自动生成的命名实体识别系统性能.企业管理,2010-01.
10欧阳恩;李作高;李昱熙;张晓艳. 基于深度学习的电子病历命名实体识别及其在知识发现中的应用.公共卫生与预防医学,2018-04.

来源期刊

智能物联技术

相关推荐

同分类资源更多

相关关键词

正例未标注学习隐马尔科夫模型命名实体识别文本挖掘

返回顶部