简介:主观题自动评分(AutomatedEssayScoring,AES)是语言测试领域的难点,自动评分的第一步往往要用大量已经人工评分的数据集生成评分模型,但是研究者常常困顿于数据集的不足。从数学的角度来看,其实只需要小数据集就可以构建出媲美大数据集所生成的评分模型,从而有效提高科研工作者的效率和数据利用率。本文提出一种小数据集抽取算法(SmallDatasetRetrievalAlgorithm,SDRA),在基于潜伏语义分析方法(LSA)的自动评分软件平台上,分别实施SDRA和传统的大数据集的评分模型方法,实验结果表明,SDRA仅用了25%的数据量,即可达到接近于传统大数据集的评分效果,从而验证了SDRA是行之有效的。
简介:为了提高抽取地震剖面的速度,首先采用字节压缩,把任意的浮点数(IEEE和IBM格式)转换一字节的整数的方法对数据体进行压缩;然后,采用八叉树算法对数据体分块,在八叉树中递归查找需要显示数据文件,完成数据体的抽取显示。
简介:内容摘要:突发公共事件频发会给国家和社会的稳定带来威胁,给人民的生命财产安全造成损失,如何从突发公共事件文本信息中提取出有用的信息并以结构化的形式展现,具有研究意义,对突发公共卫生事件预警和采取应对措施具有参考价值。本文定义了突发公共事件抽取的三个子任务,提出了基于BERT与Bi-LSTM-CRF的混合模型识别事件触发词和实体,提出了基于多层注意力机制的多分类模型进行事件元素抽取,运用模式匹配的方法抽取事件关系,取得较好效果。
简介:主观评论句中的评价对象抽取是细粒度情感分析的任务之一,在公众舆情、用户产品评论、竞争情报分析等领域有着广泛的应用价值.针对中文话题型微博语言简洁、不规范、常常省略评价对象等特点,提出一种基于语言学特征和微博结构特征的话题型微博评价对象抽取方法.通过挖掘中文微博语料的结构与内容,将词、词性、情感词、通过句法分析获得的主谓关系、来自主题标签生成的主题词序列以及由语义角色标注所获得的施事与受事中的名词等多种特征相融合,同时将评价对象抽取看作序列标注问题,建立条件随机场模型进行学习并训练。实验结果表明,语言学特征和微博结构特征使准确率提高了约10%.
简介:【内容摘要】针对学生学习中存在的地质剖面图识别困难,我们从厘清岩层新老关系、判断地质构造类型、阐述地质作用过程、判断沉积地理环境四个方面探讨地质平面图的识别问题,以期用最实用方法最通俗的表述解决教学中的难点,学生学习中的痛点,但愿有所收益。