简介:树库是一种记录每个句子句法分析结果的标注语料库。文章介绍的是美国宾州大学构建的中文树库(CTB)。描写句子的谓词一沦元结构是CTB标注的一个重要目标。因此,它在句法标注中刻意强调的是以下三个抽象的语法关系:中心语补足语关系、中心语一附加语关系和并列关系。在CTB中每个短语节点所支配的括号对或子树只表示上述的一种语法关系。此外,CTB在语法体系上也有很多特点,文章仅选取补足语、汉语的标句词“(DEC)”以及遵循语杠理论的词性标注准则等三个汉语语法问题来进行讨论。如果我们同意句子的谓词~论元结构描写是树库建设的一个重要目标,那么上述三个问题不仅同这个目标紧密关联,而且将影响到基于树库的自动词性标注和句法分析系统的性能及其后续应用的结果。
简介:自然语言处理研究进入句处理阶段以后,无论基于规则还是基于统计的策略,都面临"句法—语义"接口或界面问题。本文基于大规模语义知识库,从词汇语义和句法语义两个维度,按照"词汇单位—角色转化—范畴排序—句法实现"的思路,以手部动作义场中"打"子场为典型个案,考察词汇单位凭借范畴义征实现为角色范畴的机制、角色的排序机制以及角色的句法配位规律,揭示了词汇语义对角色范畴句法实现的制约特点,以及角色的排序模式和句法实现的位置特点。