简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
简介:"在日"文学是指日本殖民朝鲜半岛时期(1910~1945)来到日本或被强行带到日本的朝鲜人主要用"日语"创作的文学总称。这些文学围绕着1945年8月5日朝鲜"解放"后仍残留于日本的朝鲜人不回国的理由、战后朝鲜半岛的南北分裂状况以及日本社会存在着的"民族(朝鲜人)差别"等问题,追问自我民族身份而创作的小说、诗歌和短歌等。以最初获得芥川奖的李恢成为首,"在日"作家历经第一世代(朝鲜半岛出生)、第二世代(日本出生)、第三·第四世代(父母及作家本人均日本出生)四个文学世代的历史,在日本战后文学史中占有一席之地。然而,在战后70多年的当今,"在日"文学如何坚守自我的民族身份,在日本现代文学中占据怎样的位置,又将走向何方等,伴随着第一世代文学者的相继故去,第三、第四世代文学者肩负着重要的课题。