简介:
简介:基于文本语义分析的自动文摘研究对于提高自动文摘的质量具有重要意义.利用语义信息进行文本机器处理的重要步骤就是建立详尽的语义词典,而建立语义词典首先必须使用逻辑语言对文本的语义信息加以形式化表示.借用逻辑人工语言的概念层次结构,可以对词典中的概念进行分类,并将概念分解为义子.通过计算文本中句子之间的语义相关度,就可以自动生成组成文本文摘的句子.
简介:中文姓名的辨识是自动分词、自动文摘的基础.独立于自动分词,我们运用姓名用字概率和规则,设计并实现了一个中文姓名辨识系统.对207757字语料进行了测试,召回率达到92.57%,精确率达到80.35%,且速度较快.
简介:本文将动结式晚出派的判断标准概括为“V2自动词化标准”,指出这条标准过于严格,在判断动结式时难以贯彻到底,操作性不强。文章结合六朝至唐宋时期的八部文献,对“破、断、坏、灭”等4个动词的使动用法和用于动结式的情况进行了统计,据此分析了这条标准存在局限性的根源。
简介:在线写作自动评价系统(简称AWE)正应用于中美两国的教学中。本文汇报的是在线写作自动评价系统在中国大连的个案研究。2010年在大连的中学开展了一项准实验。结果显示,系统对实验组产生了积极的影响,影响大小为0.30。本文同时汇报学生问卷和教师观察数据来阐明系统的应用对教师、学生以及学生写作成绩的影响。
简介:多义动词的处理是词义自动标注的重点、难点,在组合关系中基于选择限制产生的搭配特征是词义自动标注的主要依据。论文对903个多义动词在真实语境中的分布、组合、搭配进行分析,讨论了多义动词在计算机环境中的识别条件与方法。第一章对选题的基础理论"义项形式论"和核心概念"区别性形式特征"进行了阐释。机器处理语言具有重形式的特点,义项形式特征指义项在具体语境使用中呈现出来的有规律,能够加以归类、概括,并能被计算机识别的标志物(以语义搭配为主),
简介:汉语复句层次关系自动识别是中文信息处理中很有意义而极具挑战性的一项课题。为解决由于关系词省略和关系词不能标示分句间层次组合顺序的局限,考察了1-2型和2—1型三分句复句关联模式的关系词隐现形式,发现12种关系词隐现形式的复句有望实现层次关系识别,这些隐现形式的关系词句法特征与分句组合顺序间存在4种制约规则。结合这些隐现形式的特征信息和分句层次组合制约规则,提出了一种基于规则的层次关系识别流程,以期为实现复句层次关系自动识别打下基础。
简介:实际应用发现,MicrosoftOfficeWord自动拼音标注系统存在不完善之处,如音节拼写错误、变调错误、轻声错误、多音字词标音错误、隔音符号遗漏等。调查多种在线和单机版字音转化工具,指出存在的问题。在真实文本语料支持下,基于规则和统计相结合的原则尝试解决汉语自动拼音标注系统的准确及高效问题。
简介:本文结合藏文各类形态特征,首次提出了一种基于格助词和接续特征(BCCF,BasedonCase-auxiliarywordandContinuousFeature)的书面藏文自动分词方案.其总体技术特点是:在格助词、接续特征、字性知识库以及词典支持下,进行逐级定位的确定性分词.初步测试表明:这一方案在发现和消除切分歧义、解决未登录词问题,进而在提高藏文分词精度方面具有很高的实用价值.
简介:据新加坡《联合早报》消息,要批改堆积如山的华文作文,是不少华文教师头痛的工作,新加坡华文教研中心研发了一个自动作文评改与学习系统,利用电脑自动评改小学生的作文,8秒内就能评改一篇300字的文章。
自动词的总代表──ナル
基于语义分析的文本自动文摘研究
基于统计和规则的中文姓名自动辨识
“V2自动词化标准”献疑
在线写作自动评价系统的影响:大连的个案
面向词义自动标注的多义动词选择限制研究
基于规则的汉语复句层次关系自动识别研究
微软汉语拼音及自动字音转换问题初论
基于格助词和接续特征的藏文自动分词方案
通过自动检测电脑软件漏洞来打击黑客
新加坡华文教研中心研发自动作文评改与学习系统
蒙古语《同音同形电子词典》中分类标记的自动标注法
汉蒙双语材料的自动排列与蒙古语“多语单位”的识别方法