简介:主观题自动评分(AutomatedEssayScoring,AES)是语言测试领域的难点,自动评分的第一步往往要用大量已经人工评分的数据集生成评分模型,但是研究者常常困顿于数据集的不足。从数学的角度来看,其实只需要小数据集就可以构建出媲美大数据集所生成的评分模型,从而有效提高科研工作者的效率和数据利用率。本文提出一种小数据集抽取算法(SmallDatasetRetrievalAlgorithm,SDRA),在基于潜伏语义分析方法(LSA)的自动评分软件平台上,分别实施SDRA和传统的大数据集的评分模型方法,实验结果表明,SDRA仅用了25%的数据量,即可达到接近于传统大数据集的评分效果,从而验证了SDRA是行之有效的。
简介:今藏北京大学图书馆的明刻本《陈白阳集(十卷附录一卷)》,系明代著名画家、吴门画派重要人物之一陈淳的诗文集。该集是陈淳五世从孙陈明卿辑录、编纂、刊行的。笔者在校订该文集过程中,发现其中存在标题错讹、诗(词)内容讹误、错收、重收等问题。今逐一列出,以期勘正。
简介:巢湖地区下志留统高家边组页岩XRD衍射分析表明,页岩主要由伊利石,绿泥石和石英组成。根据沉降法获得石英等脆性矿物平均含量约为67.8%,黏土矿物平均含量约为25.12%。场发射环境扫描电镜对样品进行微观孔隙结构观察,发现页岩的孔隙主要有4种类型,即粒间孔隙、粒内孔隙、裂缝孔隙和溶蚀孔隙。其中粒间孔隙和溶蚀孔隙大量发育,它们是页岩气的重要的储集空间;裂缝孔隙发育良好,是页岩气运移的主要通道。页岩成分和结构之间关系进一步分析表明,页岩中石英等大量脆性矿物的存在,有利于页岩中裂缝的形成;而黏土矿物的存在,不仅能增加有机质含量,并且有利于页岩气的储集。综合分析认为,巢湖地区下志留统高家边组页岩具有较好的储集性能。
简介:角度域共成像点道集(ADCIGS)是偏移速度分析和振幅随角度变化分析(AVA)的基础数据。传统Kirchhoff叠前深度偏移(KPSDM)按偏移距组织数据,能方便的输出偏移距域共成像点道集(ODCIGS),其高效的角度道集输出是有挑战的。本文提出基于旅行时梯度场的KPSDM角道集输出方法。其核心步骤为:(1)利用任意介质中的动态规划法旅行时计算方法提供炮点和检波点的旅行时场;(2)根据旅行时场的梯度方向计算反射张角;(3)在偏移过程中抽取ADCIGS。由于本文旅行时计算方法没有射线阴影区,也没有对速度光滑性的要求,其角度道集输出在阴影区比传统射线追踪更有优势。基于该角度道集输出方法,本文发展了一种适合大规模三维地震数据的KPSDM及角道集输出的并行实现方案。其基本思想是:(1)按照炮数据来组织输入数据;(2)旅行时场的输入与单炮覆盖范围相联系以节省内存;(3)多炮数据间采用MPI并行处理,单炮深度切片之间采用OpenMp并行处理,可进一步提高内存利用率和并行力度。数值试验结果证明本文角度道集生成方法的优越性和本文实现方案的有效性。