学科分类
/ 1
8 个结果
  • 简介:语言运用测试(1anguageperformanceassessment)因其对语言综合应用能力较为直接的测量和相对较高的真实性,成为越来越多大型考试中必不可少的组成部分。然而考试过程中所引入的评分员主观判断以及评分标准的建立与使用等因素都会在很大程度上影响考试的信效度和公平性。本文对语言测试研究领域中关于主观评分误差的研究,尤其是从评分员角度进行的研究,做了一次系统的梳理,并分析了不同的研究方法各自的特点和存在的局限,以期为更多从事评分误差控制的研究者和实践者提供丰富的参考依据。

  • 标签: 语言运用测试 评分效度 评分员 评分误差
  • 简介:文章针对目前网阅环境下作文"一评"定分评分方法的缺陷,提出了将"三评法"应用于作文评分中。结果表明,"一评法"下,评分员间一致性不够理想,存在显著性差异。"三评法"在一定程度上降低了评分误差,确保了阅卷质量。但这种方法在实施过程中也要注意避免三评人员的求稳心理,以确保该方法得到科学合理的使用。对于该方法能否投入到大规模作文网上评分中,还有待进一步研究。

  • 标签: 网上评分 三评法 评分员信度
  • 简介:评分人效应足导致评分人差异的主要原因,而已有文献对写作评估中因评分人性别产生的评分人效应的差异研究不多。因此,本研究通过多层面Rasch模型,对9位男评分人和18位女评分人对30份CET4模拟作文的评分结果进行分析,旨在探究不同性别CET4评分人在评分严厉度、集中趋势和评分人和考生的偏差等三方而的差异。结果表明:(1)尽管评分人个体之间存在严厉度的显著区别,但是男、女评分人在评分严厉度七没有出现明显的组问差异。此外,男评分人容易出现评分不拟合,女评分人容易出现过度拟合。(2)男、女评分人都没有明显的集中趋势,但相对而言男评分人给分出现集中趋势的可能性更大。(3)男评分人的给分更容易出现随机现象,评分一致性较女评分人差,且男、女评分人对不同能力考生产生的偏差具有不同的模式。本研究成果对于大规模二语写作测试的评分人培训和监控有一定参考价值。

  • 标签: 二语写作测试 评分人效应 性别差异 多层面RASCH模型
  • 简介:本文在介绍分析自动作文评分系统在国内外应用情况的基础上,试图找到语料库技术与作文自动评分技术的接口,探寻语料库在自动评分系统中的应用空间。

  • 标签: 作文 自动评分 语料库
  • 简介:近五十年来,国内外相继开发出多个英语作文自动评分系统,研究日臻成熟。在翻译领域,自动评分研究主要局限于机器翻译评价,人工译文自动评分研究仍处于初级阶段。近年国内建立起针对中国学生的汉译英自动评分模型,针对英译汉的自动评分研究也开始起步。由于中国学生的英译汉具有自身的特点,其评分系统在变量挖掘、模型验证等方面与已有研究不同。

  • 标签: 自动评分 作文 翻译 学生英译汉
  • 简介:目前高校公共体育课所用评分表,主要根据教育部公布的《中国学生体质健康评分表》(以下简称《评分表》),该评分表对公共体育课的评分起到了重要的导向作用.但各类学校由于受各种条件的限制,测试项目各有不同,且每年所招收学生的整体素质不等,该评分表豆出了一定的局限性,因此,通过对累进评分表的灵活运用,制作出符合各校学生实际情况的评分表。

  • 标签: 公共体育 累进计分法 评分表
  • 简介:本文以某届国际奥林匹克运动会女子跳水决赛为例,综合应用CTT、GT和IRT三大测量理论进行评分者信度分析,从不同角度揭示评分者之间和评分者内部的差异情况。结果表明:CTT的评分者信度分别为0.981和078;GT的概化系数和可靠性指数分别为0.8279和0.8271,比赛中所采用的7名评委分别对选手在5轮上的跳水表现进行评定的决策是比较适宜的决策;在IRT中,相对而言,评委5在7名评委中最为严厉,评委2最为宽松,但评委之间在宽严程度上的差异不显著,评委1和评委4在自身一致性上存在问题,不同评委在评定不同选手、不同难度系数动作和不同轮数上存在偏差,但未达到显著性水平。基于本文的分析,可以了解三种评分者信度分析方法的特点及各自优势,为评分:者培训和提高评分信度提供有用信息。

  • 标签: 评分者信度 经典测量理论 概化理论 多面RASCH模型 跳水决赛
  • 简介:2013年是新课程高考的第7个年头。综观7年来新课程高考的主观题可以发现,封闭性试题一直是主观题的主角,各地在开放性试题方面也进行了一些有益的探索,但总体看,开放性试题命褂没有取得实质性进展和突破,更多的仍是一种“点缀”,未能发挥开放性试题应有的功能。目前,高考政治开放性试题命制状况究竟如何?制约其推进的症结何在?突破口又在哪里?本文试图和大家共同探讨这些问题。一、开放性试题命制的现状分析目前,新课程卷高考试题的开放性主要体现在以下几个方面:(1)部分封闭(或半封闭)性试题答案的开放。常见的是答案设置多个要点,要求考生能回答其中的部分要点即可,或在评分标准中规定,其他观点言之有理,酌情给分等。(2)两可性问题由考生选择正方或反方(赞同或反对)中的一方观点作答。

  • 标签: 政治开放 高考试题 试题命题 评分标准 现状 开放性试题