简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
简介:本文运用语序类型学、认知语言学等相关理论,以汉语"在+NP"及其韩语对应形式为中心,对汉韩语介词相关语序、选择动因等问题进行了细致的考察和说明。本文认为类型学关注的介词相关语序中,汉韩二语在介词短语内部都基本保持了与各自语言基本语序的和谐,体现了语言表达的经济性原则。但在句法层次上,韩语受限于动词强制居尾的句法结构特点,在距离象似原则的支配下,与VP形成和谐组配;而句法化程度较低的汉语则因为距离象似与时间象似性原则的竞争与妥协,以及介词语法化、动补结构发达等因素的共同作用,不仅大量派生介词框式结构,介词短语语序也呈现比韩语复杂的局面。