Srovnání skóre

Srovnání skóre nebo test equating tradičně odkazuje na statistický proces stanovení srovnatelných skóre na různých formách zkoušky. Lze ho dosáhnout buď pomocí klasické teorie testů nebo teorie odezvy položek.

Rovnocennost je v teorii odezvy položek proces vyrovnání jednotek a původu dvou stupnic, na nichž byly schopnosti studentů odhadnuty z výsledků různých testů. Tento proces je analogický vyrovnání stupňů Fahrenheita se stupni Celsia převodem měření z jedné stupnice na druhou. Stanovení srovnatelných skóre je vedlejším produktem vyrovnání, které vyplývá z vyrovnání stupnic získaných z výsledků testů.

Proč je rovnání nutné?

Předpokládejme, že Dick i Jane si udělají test, aby získali licenci pro určité povolání. Protože vysoké sázky (můžete vykonávat toto povolání, pokud test složíte) mohou vytvořit pokušení podvádět, organizace, která na test dohlíží, vytvoří dvě formy. Pokud víme, že Dick získal 60% z formuláře A a Jane 70% z formuláře B, víme jistě, který z nich má lepší přehled o materiálu? Co když se formulář A skládá z velmi obtížných položek, zatímco formulář B je relativně snadný? Rovnocenné analýzy se provádějí, aby se řešila právě tato otázka, aby výsledky byly co nejspravedlivější.

Rovnice v položce Teorie odpovědi

Obrázek 1: Křivky charakteristik zkoušek ukazující vztah mezi celkovým skóre a umístěním osoby pro dva různé testy ve vztahu ke společné stupnici. V tomto příkladu se celkem 37 v hodnocení 1 rovná celkem 34,9 v hodnocení 2, jak ukazuje svislá čára

V položkové teorii odpovědí jsou místa osob odhadnuta na stupnici; tj. místa jsou odhadnuta ve vztahu k jednotce a původu. Ve vzdělávacím hodnocení je běžné používat testy za účelem posouzení různých skupin studentů se záměrem vytvořit společnou stupnici tím, že se porovná původ, a někdy jednotky, stupnic získaných z údajů o odezvě z různých testů. Tento proces se označuje jako vyrovnání nebo test vyrovnání.

V teorii odpovědí položek jsou dva různé druhy vyrovnávání horizontální a vertikální vyrovnávání . Vertikální vyrovnávání se týká procesu vyrovnávání testů podávaných skupinám studentů s různými schopnostmi, jako jsou studenti v různých stupních (roky školní docházky) . Horizontální vyrovnávání se týká vyrovnávání testů podávaných skupinám s podobnými schopnostmi; například dva testy podávané studentům ve stejné třídě ve dvou po sobě jdoucích kalendářních letech. Různé testy se používají, aby se zabránilo praktickým efektům.

Z hlediska teorie odezvy položek je ekvalizace jen zvláštním případem obecnějšího procesu škálování, použitelného při použití více než jednoho testu. V praxi je však škálování často realizováno samostatně pro různé testy a poté jsou váhy následně ekvalizovány.

Často se rozlišuje mezi dvěma metodami ekvivalence; obyčejná osoba a obyčejná položka ekvivalence. Obyčejná osoba ekvivalence zahrnuje podání dvou zkoušek na společnou skupinu osob. Střední a směrodatná odchylka umístění stupnice skupin v obou zkouškách se rovná pomocí lineární transformace. Obyčejná položka ekvivalence zahrnuje použití společných položek vložených do dvou různých zkoušek. Střední položka umístění společných položek se rovná.

Klasické přístupy k rovnání

V klasické teorii testů se průměrem rovnání jednoduše upravuje rozdělení skóre tak, aby průměr jednoho tvaru byl srovnatelný s průměrem druhého tvaru. Lineární rovnání se upravuje tak, aby oba tvary měly srovnatelný průměr a směrodatnou odchylku. Rovnocenné rovnání určuje rovnání jako jeden, kde by skóre mohlo mít rovnocenný percentil v obou tvarech.

Na rozdíl od teorie odezvy položek je ekvivalence založená na klasické teorii testů poněkud odlišná od škálování. Ekvivalence je raw-to-raw transformace v tom, že odhaduje raw skóre na formuláři B, které odpovídá každému raw skóre na základním formuláři A. Jakákoli použitá škálovací transformace se pak aplikuje nad ekvivalenci nebo s ní.