Kritériem srovnávaný test je test, který umožňuje převést výsledek testu do prohlášení o chování, které lze očekávat od osoby s tímto skóre nebo jejich vztahu k určitému předmětu. Většina testů a kvízů napsaných učiteli ve školách jsou kritériem srovnávané testy. Cílem je jednoduše zjistit, zda se student naučil materiál nebo ne. Naproti tomu u normou srovnávaného testu překládané skóre říká, zda si testovaný vedl lépe nebo hůře než ostatní lidé, kteří test dělali. Robert Glaser původně razil oba termíny.[1]
Například pokud je kritériem „Studenti by měli být schopni správně sčítat dvě jednociferná čísla“, pak rozumné testové otázky mohou vypadat jako „2+3 = ?“ nebo „9+5 = ?“ Kritériem srovnávaný test by hodnotil výkon studenta přesně podle toho, zda jednotlivý student na tyto otázky správně odpověděl. Normou srovnávaný test by hodnotil především to, zda tento student správně odpověděl na více otázek ve srovnání s ostatními studenty ve skupině.
I při testování podobných témat může test, který je navržen tak, aby přesně zhodnotil zvládnutí, použít jiné otázky než ten, který má ukázat relativní pořadí. Je to proto, že některé otázky lépe odrážejí skutečné výsledky studentů a některé testové otázky lépe rozlišují mezi nejlepšími studenty a nejhoršími studenty. (Mnoho otázek zvládne obojí.) Test s odkazem na kritéria bude používat otázky, které byly správně zodpovězeny studenty, kteří znají konkrétní materiál. Test s odkazem na normy bude používat otázky, které byly správně zodpovězeny „nejlepšími“ studenty a nebyly správně zodpovězeny „nejhoršími“ studenty.
Některé testy mohou poskytnout užitečné informace jak o skutečných výsledcích, tak o relativním pořadí. ACT poskytuje jak pořadí, tak i údaj o tom, jaká úroveň je považována za nezbytnou pro pravděpodobný úspěch na vysoké škole.[2] Někteří tvrdí, že termín „test založený na kritériích“ je chybné pojmenování, protože může odkazovat na interpretaci skóre i na test samotný.[3] V předchozím příkladu lze stejné skóre na ACT interpretovat normou odkazovaným nebo kritériem odkazovaným způsobem.
Testování podle kritérií bylo hlavním zaměřením psychometrického výzkumu v 70. letech [4].
Častým nedorozuměním, pokud jde o termín, je význam kritéria. Mnoho, ne-li většina, testů s odkazem na kritérium zahrnuje cutscore, kdy zkoušený uspěje, pokud jeho skóre překročí cutscore a neuspěje, pokud neuspěje (často se tomu říká mastery test). Kritériem není cutscore; kritériem je doména předmětu, kterou má test posoudit. Kritériem může být například „Studenti by měli být schopni správně sečíst dvě jednociferná čísla“ a cutscore může být, že studenti by měli správně odpovědět minimálně na 80% otázek, které musí projít.
Interpretace skóre testu podle kritérií určuje vztah k předmětu. V případě mistrovského testu to znamená určit, zda zkoušející „zvládl“ stanovenou úroveň předmětu porovnáním jeho skóre s skóre cutscore. Ne všechny testy podle kritérií však mají skóre cutscore a skóre může jednoduše odkazovat na postavení člověka v předmětu. [5] ACT je opět toho příkladem; neexistuje žádné skóre cutscore, je to prostě hodnocení studentových znalostí předmětu na úrovni střední školy.
Kvůli tomuto běžnému nedorozumění byly některé vzdělávací agentury nazývají testy založené na kritériích také hodnoceními založenými na standardech[6], neboť studenti jsou posuzováni s ohledem na standardy, které definují, co by „měli“ vědět, jak je definuje stát.[7]
Validace testů s referenčními kritérii
Pro ověření testu s odkazem na normy je standardním postupem zkoumání korelací s externími stupnicemi podobného obsahu nebo porovnání výkonnosti různých skupin. U testů s odkazem na kritéria je důležitější vědět, jak přesná je míra shody kritérií, což Retzlaff & Gibertini 1994 označila za provozní charakteristiky testu. Argumentovali tím, že tento typ testu má být validován podle pěti kritérií:
Mnoho testů s referenčními kritérii jsou důležité testy, kde výsledky testu mají důležité důsledky pro jednotlivého zkoušejícího. To lze také popsat jako „hodně ztratíte, pokud neprojdete.“[8] Příkladem jsou maturitní zkoušky na střední škole nebo osvědčení o počátečním magisterském vzdělání a licenční zkoušky, kde musí být test úspěšně proveden, aby mohl pracovat v profesi.
Kritériem odkazované testy byly některými vzdělávacími agenturami označovány jako hodnocení založená na standardech,[9] kde jsou studenti hodnoceni s ohledem na standardy, které definují, co by „měli“ vědět, jak je definuje stát.[10] Některé testy stanovují standard, který na počátku neuspěl u 50 až 80 procent studentů,[11] vyšší, ne nižší míru neúspěšnosti, než je možné při standardním definování 50 procent, které spadá pod průměr.