Úroveň měření

„Úrovně měření“ nebo měřítka jsou výrazy, které obvykle odkazují na teorii typů měřítek, kterou vypracoval psycholog Stanley Smith Stevens. Stevens svou teorii navrhl v roce 1946 ve vědeckém článku nazvaném „On the theory of scales of measurement“. V tomto článku Stevens tvrdil, že veškeré měření ve vědě se provádí pomocí čtyř různých typů stupnic, které nazval „nominální“, „ordinální“, „intervalové“ a „poměrové“.

Stevens (1946, 1951) navrhl, že měření lze rozdělit do čtyř různých typů stupnic. Ty jsou uvedeny v následující tabulce: nominální, ordinální, intervalové a poměrové.

V nominálním měřítku, tj. pro nominální kategorii, se používají značky; například horniny lze obecně rozdělit na vyvřelé, sedimentární a metamorfované. Pro tuto škálu jsou některé platné operace ekvivalence a příslušnost k množině. Nominální míry nabízejí názvy nebo štítky pro určité charakteristiky.

Proměnné hodnocené na nominální škále se nazývají kategoriální proměnné; viz také kategoriální data. Kategoriálně typizované náhodné proměnné, které mají pouze dva možné výsledky (často označované jako „ano“ vs. „ne“ nebo „úspěch“ vs. „neúspěch“), se nazývají binární proměnné (nebo Bernoulliho proměnné) a jsou charakterizovány pomocí Bernoulliho rozdělení. Kategoriální proměnná se třemi nebo více výsledky se někdy označuje jako vícecestná (nebo K-cestná pro určitou konkrétní hodnotu K) a je charakterizována kategoriálním rozdělením.

Stevens(1946, s. 679) musel vědět, že tvrzení, že nominální stupnice měří zjevně nekvantitativní věci, by vyvolalo kritiku, a proto se odvolal na svou teorii měření, aby nominální stupnice jako měření ospravedlnil:

Centrální tendence nominálního atributu je dána jeho modem; průměr ani medián nelze definovat.

Můžeme použít jednoduchý příklad nominální kategorie: křestní jména. Když se podíváme na lidi v okolí, můžeme najít jednoho nebo více z nich, kteří se jmenují Aamir. Aamir je jejich označení a množina všech křestních jmen je nominální stupnice. Můžeme pouze zkontrolovat, zda se dva lidé jmenují stejně (ekvivalence) nebo zda je dané jméno v určitém seznamu jmen (příslušnost k množině), ale nelze říci, které jméno je větší nebo menší než jiné (porovnání), ani změřit rozdíl mezi dvěma jmény. Při dané množině osob můžeme tuto množinu popsat pomocí nejčastějšího jména (modus), ale nemůžeme poskytnout „průměrné jméno“ nebo dokonce „prostřední jméno“ mezi všemi jmény. Pokud se však rozhodneme seřadit jména podle abecedy (nebo je seřadit podle délky; nebo podle toho, kolikrát se vyskytují ve sčítání lidu v USA), začneme tuto nominální stupnici měnit na ordinální.

Při řazení dat do pořadí se data jednoduše umístí na ordinální stupnici. Ordinální měření popisuje pořadí, ale ne relativní velikost nebo stupeň rozdílu mezi měřenými položkami. V tomto typu stupnice představují čísla přiřazená objektům nebo událostem pořadí (1., 2., 3. atd.) hodnocených entit. Příkladem ordinální stupnice je výsledek dostihu, který říká pouze to, kteří koně dojeli první, druzí nebo třetí, ale neobsahuje žádné informace o časech dostihu. Dalším příkladem jsou vojenské hodnosti; mají pořadí, ale žádný přesně definovaný číselný rozdíl mezi hodnostmi.

Při použití ordinální škály lze centrální tendenci skupiny položek popsat pomocí modu (nejčastější položky) nebo mediánu (prostřední položky), ale nelze definovat průměr (nebo průměr).

V roce 1946 si Stevens všiml, že psychologická měření obvykle fungují na ordinálních stupnicích a že běžné statistiky jako průměry a směrodatné odchylky nemají platnou interpretaci. Přesto lze tyto statistiky často použít k získání plodných informací s tím, že při vyvozování závěrů z těchto statistických údajů je třeba postupovat opatrně.

Doporučujeme:  10 psychologických teorií, které můžete použít k přesvědčování lidí

Psychometrici rádi teoretizují, že psychometrické testy vytvářejí intervalové škály kognitivních schopností (např. Lord & Novick, 1968; von Eye, 2005), ale existuje jen málo důkazů, které by naznačovaly, že tyto atributy jsou u většiny psychologických dat něčím jiným než ordinálními (Cliff, 1996; Cliff & Keats, 2003; Michell, 2008). Zejména skóre IQ odráží spíše ordinální škálu, v níž mají všechna skóre význam pouze pro srovnání, než intervalovou škálu, v níž daný počet „bodů“ IQ odpovídá jednotce inteligence. Je tedy chybou napsat, že IQ 160 se liší od IQ 130 stejně jako IQ 100 od IQ 70. V tomto případě se jedná o chybu.

V matematické teorii pořadí definuje ordinální stupnice celkové předpořadí objektů (v podstatě způsob řazení všech objektů, v němž mohou být některé z nich vázané). Samotné hodnoty stupnice (například označení jako „skvělý“, „dobrý“ a „špatný“; 1., 2. a 3.) mají celkové pořadí, kdy mohou být seřazeny do jedné řady bez dvojznačností. Pokud jsou k definici stupnice použita čísla, zůstávají správná, i když jsou transformována libovolnou monotónně rostoucí funkcí. Tato vlastnost je známá jako izomorfismus pořadí. Následuje jednoduchý příklad:

Protože x-8, 3x a x3 jsou monotónně rostoucí funkce, nahrazení pořadového skóre rozhodčího jakýmkoli z těchto alternativních skóre nemá vliv na relativní pořadí kuchařských schopností pěti osob. Každý sloupec čísel je stejně legitimní ordinální stupnicí pro popis jejich schopností. Číselný (aditivní) rozdíl mezi různými ordinálními skóre však nemá žádný zvláštní význam.

Kvantitativní atributy jsou všechny měřitelné na intervalových stupnicích, protože jakýkoli rozdíl mezi úrovněmi atributu lze vynásobit libovolným reálným číslem a překročit tak jiný rozdíl nebo se mu rovnat. Velmi známým příkladem měření na intervalové stupnici je teplota pomocí stupnice Celsia. V této konkrétní stupnici je měrnou jednotkou 1/100 rozdílu teplot mezi bodem tuhnutí a varu vody při tlaku 1 atmosféry. „Nulový bod“ na intervalové stupnici je libovolný a lze použít i záporné hodnoty. Formální matematický termín je afinní prostor (v tomto případě afinní přímka). Veličiny měřené na intervalové úrovni se nazývají „intervalové proměnné“ nebo někdy „škálované proměnné“, protože mají měrné jednotky.

Poměry mezi čísly na stupnici nejsou smysluplné, takže operace jako násobení a dělení nelze provádět přímo. Poměry rozdílů však vyjádřit lze; například jeden rozdíl může být dvojnásobkem druhého.

Centrální tendenci proměnné měřené na úrovni intervalu lze vyjádřit pomocí modu, mediánu nebo aritmetického průměru. Statistický rozptyl lze měřit většinou obvyklých způsobů, které právě zahrnovaly rozdíly nebo průměrování, jako je rozsah, mezikvartilové rozpětí a směrodatná odchylka. Protože nelze dělit, nelze definovat míry, které vyžadují poměr, jako je studovaný rozsah nebo variační koeficient. Ještě jemněji lze sice definovat momenty kolem počátku, ale užitečné jsou pouze centrální momenty, protože volba počátku je libovolná a nemá smysl. Lze definovat standardizované momenty, protože poměry rozdílů jsou smysluplné, ale nelze definovat variační koeficient, protože průměr je momentem kolem počátku, na rozdíl od směrodatné odchylky, která je (druhou odmocninou) centrálního momentu.

Většina měření ve fyzikálních a technických vědách se provádí na poměrových stupnicích. Hmotnost, délka, čas, rovinný úhel, energie a elektrický náboj jsou příklady fyzikálních měřítek, která jsou poměrovými stupnicemi. Název tohoto typu stupnice vychází ze skutečnosti, že měření je odhadem poměru mezi velikostí spojité veličiny a jednotkovou veličinou stejného druhu (Michell, 1997, 1999). Neformálně je charakteristickým rysem poměrové stupnice vlastnictví nulové hodnoty. Například Kelvinova teplotní stupnice má nearbitrární nulový bod absolutní nuly, který se označuje 0 K a rovná se -273,15 stupňů Celsia. Tento nulový bod přesně vyjadřuje, že částice tvořící hmotu mají při této teplotě nulovou kinetickou energii.

Doporučujeme:  Distanční jazyk

Příklady poměrového měření v behaviorálních vědách téměř neexistují. Luce (2000) tvrdí, že příklad poměrového měření v psychologii lze nalézt v teorii očekávaného užitku závislého na pořadí a znaménku.

Pro proměnnou měřenou na úrovni poměru lze použít všechna statistická měření, protože jsou definovány všechny potřebné matematické operace. Centrální tendenci proměnné měřené na úrovni poměru lze kromě modu, mediánu nebo aritmetického průměru vyjádřit také geometrickým průměrem nebo harmonickým průměrem. Kromě měr statistického rozptylu definovaných pro intervalové proměnné, jako je rozsah a směrodatná odchylka, lze pro poměrové proměnné definovat také míry, které vyžadují poměr, jako je studovaný rozsah nebo variační koeficient.

Diskuse o klasifikačním schématu

O výhodnosti klasifikací se vedly a stále vedou diskuse, zejména v případě nominální a ordinální klasifikace (Michell, 1986). Ačkoli je tedy Stevensova klasifikace široce přijímána, není v žádném případě všeobecně akceptována.

Duncan (1986) poznamenal, že Stevensova klasifikace nominálního měření je v rozporu s jeho vlastní definicí měření. Stevens (1975) ke své vlastní definici měření uvedl, že „přiřazením může být jakékoli konzistentní pravidlo. Jediným nepřípustným pravidlem by bylo náhodné přiřazení, neboť náhodnost se v podstatě rovná ne-pravidlu“. Tzv. nominální měření však zahrnuje libovolné přiřazení a „přípustnou transformací“ je jakékoli číslo za jakékoli jiné. To je jeden z bodů Lordova (1953) satirického článku On the Statistical Treatment of Football Numbers.

Mezi těmi, kteří toto klasifikační schéma přijímají, se v behaviorálních vědách vedou spory o to, zda má průměr smysl pro ordinální měření. Z hlediska teorie měření není, protože aritmetické operace se neprovádějí s čísly, která jsou měřením v jednotkách, a výsledky výpočtů tak nedávají čísla v jednotkách. Mnoho behaviorálních vědců však přesto používá průměry pro ordinální data. Často se to zdůvodňuje tím, že ordinální stupnice v behaviorálních vědách jsou ve skutečnosti někde mezi skutečnými ordinálními a intervalovými stupnicemi; ačkoli intervalový rozdíl mezi dvěma ordinálními stupnicemi není konstantní, je často stejného řádu. Například aplikace modelů měření ve vzdělávacím kontextu často ukazují, že celkové skóre má poměrně lineární vztah k měření v celém rozsahu hodnocení. Někteří tedy tvrdí, že dokud není neznámý intervalový rozdíl mezi pořadovými stupnicemi příliš proměnlivý, lze intervalové statistiky, jako jsou průměry, smysluplně používat u proměnných s pořadovými stupnicemi. Software pro statistickou analýzu, jako je PSPP, vyžaduje, aby uživatel pro každou proměnnou vybral příslušnou třídu měření. Tím je zajištěno, že následné chyby uživatele nemohou neúmyslně provést nesmyslné analýzy (například korelační analýzu s proměnnou na nominální úrovni).

L. L. Thurstone dosáhl pokroku ve vývoji zdůvodnění pro získání měření na úrovni intervalů na základě zákona srovnávacího úsudku. Běžnou aplikaci tohoto zákona viz Analytic Hierarchy Process. Dalšího pokroku dosáhl Georg Rasch (1960), který vyvinul pravděpodobnostní Raschův model, který poskytuje teoretický základ a zdůvodnění pro získávání měření na úrovni intervalů z počtů pozorování, jako jsou celkové výsledky v hodnocení.

Doporučujeme:  James Kennedy

Další problém vychází z článku Nicholase R. Chrismana „Rethinking Levels of Measurement for Cartography“, ve kterém zavádí rozšířený seznam úrovní měření, aby zohlednil různá měření, která nemusí nutně odpovídat tradičnímu pojetí úrovní měření. Měření vázaná na rozsah a opakování (jako jsou stupně v kruhu, čas atd.), odstupňované kategorie příslušnosti a další typy měření se nehodí do původní Stevenovy práce, což vedlo k zavedení 6 nových úrovní měření, které vedou k: (1) Nominální, (2) Odstupňované členství, (3) Ordinální, (4) Interval, (5) Logaritmický interval, (6) Extenzivní poměr, (7) Cyklický poměr, (8) Odvozený poměr, (9) Počty a konečně (10) Absolutní. Rozšířené úrovně měření se mimo akademickou geografii používají jen zřídka.

Typy škál a Stevensova „operační teorie měření“

Teorie typů škál je intelektuální služebnicí Stevensovy „operační teorie měření“, která se stala definitivní v psychologii a behaviorálních vědách,[citace potřebná] přestože ji Michell charakterizoval jako zcela protichůdnou k měření v přírodních vědách (Michell, 1999). Operační teorie měření byla v podstatě reakcí na závěry výboru, který v roce 1932 založila Britská asociace pro rozvoj vědy, aby prozkoumal možnost skutečného vědeckého měření v psychologických a behaviorálních vědách. Tento výbor, který se stal známým jako Fergusonův výbor, zveřejnil závěrečnou zprávu (Ferguson, et al., 1940, s. 245), v níž byla předmětem kritiky Stevensova sone scale (Stevens & Davis, 1938):

To znamená, že pokud Stevensova stupnice skutečně měřila intenzitu sluchových vjemů, pak je třeba předložit důkaz, že tyto vjemy jsou kvantitativními atributy. Potřebným důkazem byla přítomnost aditivní struktury – pojmu, který komplexně zpracoval německý matematik Otto Hölder (Hölder, 1901). Vzhledem k tomu, že v jednání Fergusonova výboru dominoval fyzik a teoretik měření Norman Robert Campbell, dospěl výbor k závěru, že měření ve společenských vědách není možné z důvodu absence konkatenačních operací. Tento závěr se později ukázal jako mylný díky objevu teorie konjunktivního měření Debreuem (1960) a nezávisle na něm Luce & Tukeyem (1964). Stevensova reakce však nespočívala v tom, že by provedl experimenty k ověření přítomnosti aditivní struktury vjemů, ale v tom, že závěry Fergusonova výboru označil za neplatné tím, že navrhl novou teorii měření:

Stevense výrazně ovlivnily myšlenky jiného harvardského akademika, nositele Nobelovy ceny za fyziku Percyho Bridgmana (1927), jehož doktrínu operacionismu Stevens použil k definici měření. Ve Stevensově definici je to například použití metru, které definuje délku (předmět měření) jako měřitelnou (a tedy implicitně kvantitativní). Kritici operacionalismu namítají, že zaměňuje vztahy mezi dvěma objekty nebo událostmi za vlastnosti jednoho z těchto objektů nebo událostí (Hardcastle, 1995; Michell, 1999; Moyer, 1981a,b; Rogers, 1989).

Kanadský teoretik měření William Rozeboom (1966) byl raným a důrazným kritikem Stevensovy teorie typů stupnic. Teprve mnohem později, v souvislosti s pracemi matematických psychologů Theodora Alpera (1985, 1987), Louise Narense (1981a, b) a R. Duncana Luce (1986, 1987, 2001), se však konceptu typů stupnic dostalo matematické přísnosti, která mu chyběla v době jeho vzniku. Jak Luce (1997, s. 395) bez obalu uvedl: