Normované opatření

Normou referenční míra je druh testu, hodnocení nebo hodnocení, ve kterém je testovaný jedinec porovnáván se vzorkem svých vrstevníků (označovaným jako „normativní vzorek“). Termínem „normativní hodnocení“ se rozumí proces porovnávání jednoho účastníka testu s jeho vrstevníky.

Alternativou k normativnímu testování mohou být testy ipsativní, to znamená, že se individuální hodnocení porovnává s ním nebo s ní časem.

Oproti tomu je test posuzován podle kritérií, pokud je stanoveno převedení výsledku testu do prohlášení o chování, které lze očekávat od osoby s tímto výsledkem. Stejný test lze použít oběma způsoby. Robert Glaser původně zavedl termíny „norm-referenced test“ a „criterion-referenced test“.

Reforma vzdělávání založená na standardech je založena na přesvědčení, že veřejné vzdělávání by mělo stanovit to, co by měl každý student vědět a co by měl umět. Studenti by měli být testováni podle pevného měřítka, spíše než proti sobě nebo roztříděni do matematické zvonové křivky. Posouzením, že každý student musí splnit tyto nové, vyšší standardy, se představitelé školství domnívají, že všichni studenti dosáhnou diplomu, který je připraví na úspěch v 21. století.

Většina státních testů úspěšnosti je referenčními kritérii. Jinými slovy, je vypracována předem stanovená úroveň přijatelného výkonu a studenti tuto úroveň dosáhnou nebo nedosáhnou. Testy, které stanovují cíle pro studenty na základě průměrného výkonu studenta, jsou testy referenčními normami. Testy, které stanovují cíle pro studenty na základě stanovené normy (např. 80 slov správně napsaných) jsou testy referenčními kritérii.

Mnoho přijímacích zkoušek na vysoké školy a celostátně používaných školních testů používá testy s referenčními normami. SAT, Graduate Record Examination (GRE) a Wechsler Intelligence Scale for Children (WISC) porovnávají výsledky jednotlivých studentů s výsledky normativního vzorku. Testující nemohou „propadnout“ v testu s referenčními normami, protože každý testovaný dostane skóre, které porovnává jednotlivce s ostatními, kteří test podstoupili, obvykle dané percentilem. To je užitečné, když existuje široký rozsah přijatelných skóre, které je pro každou vysokou školu odlišné. Například jeden odhad průměrného SAT skóre pro Harvardovu univerzitu je 2200 z 2400 možných. Průměr pro Indianskou univerzitu je 1650.

Doporučujeme:  Antiemetika

Naproti tomu téměř dvě třetiny středoškoláků v USA budou muset složit maturitní zkoušku založenou na kritériích. Jedno vysoké fixní skóre je stanoveno na úrovni odpovídající přijetí na univerzitu bez ohledu na to, zda je absolvent střední školy vázán na vysokou školu, nebo ne. Každý stát dává svůj vlastní test a stanovuje si vlastní úroveň úspěšného absolvování, přičemž státy jako Massachusetts vykazují velmi vysokou míru úspěšného absolvování, zatímco ve státě Washington propadají i průměrní studenti, stejně jako 80 procent některých menšinových skupin. Proti této praxi se staví mnoho lidí ve vzdělávací komunitě, jako je Alfie Kohn, jako nefér vůči skupinám a jednotlivcům, kteří nemají tak vysoké skóre jako ostatní.

Výhody a omezení

Zjevnou nevýhodou testů s odkazem na normy je, že nemohou měřit pokrok populace celku, pouze pokud jednotlivci spadají do celku. K měření úspěchu vzdělávacího reformního programu, jehož cílem je zvýšit úspěšnost všech studentů oproti novým standardům, které se snaží hodnotit dovednosti nad rámec výběru z více možností, lze tedy použít pouze měření podle stanoveného cíle. I když je to teoreticky atraktivní, v praxi se laťka často posouvala vzhledem k nadměrné míře neúspěšnosti a ke zlepšení někdy dochází jen díky obeznámenosti se stejným testem a výuce k němu.

U testu s odkazem na normu byla úroveň známek tradičně nastavena na úroveň nastavenou středními 50 procenty bodů. Naproti tomu Národní nadace pro čtení dětí se domnívá, že je nezbytné zajistit, aby prakticky všechny naše děti četly do třetí třídy na úrovni známek nebo nad ní, což je cíl, kterého nelze dosáhnout s definicí úrovně známek s odkazem na normu.

Kritici testů založených na kritériích poukazují na to, že soudci nastavují záložky kolem položek různé obtížnosti, aniž by zvažovali, zda jsou tyto položky skutečně v souladu s normami obsahu stupňů, nebo zda jsou vývojově vhodné. Původní vzorové problémy z roku 1997 publikované pro matematiku čtvrtých tříd WASL tak obsahovaly položky, které byly obtížné pro vysokoškolsky vzdělané dospělé, nebo byly snadno řešitelné metodami na úrovni desáté třídy, jako jsou podobné trojúhelníky.

Doporučujeme:  Posturografie

Rok od roku se mění i úroveň obtížnosti samotných předmětů, stejně jako bodové ohodnocení pro určení úrovně úspěšnosti. Míra úspěšnosti se v některých státech také značně liší od maturitních testů 4. až 7. a 10. třídy.

Jedním z nedostatků programu No Child Left Behind je, že každý stát si může zvolit nebo sestavit svůj vlastní test, který nelze srovnávat s žádným jiným státem.
Randova studie výsledků z Kentucky zjistila náznaky umělé inflace úspěšnosti průchodů, které se neodrazily ve zvýšení skóre v jiných testech, jako je NAEP nebo SAT, které byly ve stejné době podávány stejné studentské populaci.

Standardy maturitních testů jsou obvykle nastaveny na úroveň odpovídající rodilým čtyřletým uchazečům o studium na univerzitě. Neobvyklým vedlejším účinkem je, že zatímco vysoké školy často přijímají přistěhovalce s velmi silnými matematickými dovednostmi, kteří mohou být nedostateční v angličtině, neexistuje takový prostor v maturitních testech na středních školách, které obvykle vyžadují absolvování všech částí, včetně jazyka. Není tedy neobvyklé, že instituce jako Washingtonská univerzita přijímají silné asijské Američany nebo latinoameričany, kteří nesložili psací část státního testu WASL, ale takoví studenti by ani neobdrželi diplom, jakmile by byl požadavek na testování zaveden.

Ačkoli testy jako WASL jsou zamýšleny jako minimální laťka pro střední školu, 27 procent žáků 10. třídy, kteří se ucházeli o Running Start ve státě Washington, neuspělo v matematické části WASL. Tito studenti se ucházeli o vysokoškolské studium na střední škole a dosáhli mnohem vyšší úrovně než průměrní studenti. Stejná studie došla k závěru, že úroveň obtížnosti je srovnatelná nebo vyšší než u testů určených k umístění studentů, kteří již byli přijati na vysokou školu.

Test s odkazem na normu nemá žádný z těchto problémů, protože se nesnaží prosadit žádné očekávání toho, co by všichni studenti měli vědět nebo co by měli umět, kromě toho, co předvedou skuteční studenti. Současné úrovně výkonnosti a nespravedlnosti jsou brány jako fakt, nikoli jako vady, které mají být odstraněny přepracovaným systémem. Cíle studentských výkonů se nezvyšují každý rok, dokud nejsou všichni zdatní. Skóre nemusí vykazovat neustálé zlepšování prostřednictvím systémů řízení kvality Total.

Doporučujeme:  Daniel Kahneman

Hodnotový systém produkuje pouze data, která říkají, kteří průměrní studenti dosahují průměrných výsledků, kteří studenti si vedou lépe a kteří hůře. To je v rozporu se základním přesvědčením, ať už optimistickým nebo jednoduše nepodloženým, že všichni budou v systému založeném na standardech dosahovat výsledků na jedné stejně vysoké úrovni, pokud bude zavedeno dostatečné množství pobídek a trestů. Tento rozdíl v přesvědčení je základem nejvýznamnějších rozdílů mezi tradičním a standardizovaným vzdělávacím systémem.