简介:评分人效应足导致评分人差异的主要原因,而已有文献对写作评估中因评分人性别产生的评分人效应的差异研究不多。因此,本研究通过多层面Rasch模型,对9位男评分人和18位女评分人对30份CET4模拟作文的评分结果进行分析,旨在探究不同性别CET4评分人在评分严厉度、集中趋势和评分人和考生的偏差等三方而的差异。结果表明:(1)尽管评分人个体之间存在严厉度的显著区别,但是男、女评分人在评分严厉度七没有出现明显的组问差异。此外,男评分人容易出现评分不拟合,女评分人容易出现过度拟合。(2)男、女评分人都没有明显的集中趋势,但相对而言男评分人给分出现集中趋势的可能性更大。(3)男评分人的给分更容易出现随机现象,评分一致性较女评分人差,且男、女评分人对不同能力考生产生的偏差具有不同的模式。本研究成果对于大规模二语写作测试的评分人培训和监控有一定参考价值。
简介:本文以某届国际奥林匹克运动会女子跳水决赛为例,综合应用CTT、GT和IRT三大测量理论进行评分者信度分析,从不同角度揭示评分者之间和评分者内部的差异情况。结果表明:CTT的评分者信度分别为0.981和078;GT的概化系数和可靠性指数分别为0.8279和0.8271,比赛中所采用的7名评委分别对选手在5轮上的跳水表现进行评定的决策是比较适宜的决策;在IRT中,相对而言,评委5在7名评委中最为严厉,评委2最为宽松,但评委之间在宽严程度上的差异不显著,评委1和评委4在自身一致性上存在问题,不同评委在评定不同选手、不同难度系数动作和不同轮数上存在偏差,但未达到显著性水平。基于本文的分析,可以了解三种评分者信度分析方法的特点及各自优势,为评分:者培训和提高评分信度提供有用信息。
简介:2013年是新课程高考的第7个年头。综观7年来新课程高考的主观题可以发现,封闭性试题一直是主观题的主角,各地在开放性试题方面也进行了一些有益的探索,但总体看,开放性试题命褂没有取得实质性进展和突破,更多的仍是一种“点缀”,未能发挥开放性试题应有的功能。目前,高考政治开放性试题命制状况究竟如何?制约其推进的症结何在?突破口又在哪里?本文试图和大家共同探讨这些问题。一、开放性试题命制的现状分析目前,新课程卷高考试题的开放性主要体现在以下几个方面:(1)部分封闭(或半封闭)性试题答案的开放。常见的是答案设置多个要点,要求考生能回答其中的部分要点即可,或在评分标准中规定,其他观点言之有理,酌情给分等。(2)两可性问题由考生选择正方或反方(赞同或反对)中的一方观点作答。