Z-test

Z-test je statistický test používaný v inferenci, který určuje, zda je rozdíl mezi výběrovým průměrem a průměrem populace dostatečně velký, aby byl statisticky významný.

Aby byl Z-test spolehlivý, musí být splněny určité podmínky. Nejdůležitější z nich je, že Z-test používá populační průměr a populační směrodatnou odchylku, a proto musí být tyto údaje známy. Vzorek musí být prostým náhodným vzorkem populace. Pokud vzorek pochází z jiné výběrové metody, je třeba použít jiný vzorec. Musí být také známo, že se populace mění normálně (tj. výběrové rozdělení pravděpodobností možných hodnot odpovídá standardní normální křivce). Pokud není známo, že se populace mění normálně, stačí mít dostatečně velký vzorek, obecně se má za to, že je to ≥ 30 nebo 40 vzorků.

Ve skutečnosti je znalost skutečné σ populace nereálná, s výjimkou případů, jako je standardizované testování, kdy je známa celá populace. V případech, kdy není možné změřit každého člena populace, je reálnější použít t-test, který používá standardní chybu získanou ze vzorku spolu s t-rozdělením.

Test vyžaduje, aby byly známy následující údaje:

Nejprve vypočtěte směrodatnou chybu (SE) průměru:

Vzorec pro výpočet z-skóre pro Z-test je následující:

Nakonec se z-skóre porovná se Z-tabulkou, což je tabulka, která obsahuje procento plochy pod normální křivkou mezi průměrem a z-skóre. Použití této tabulky ukáže, zda je vypočtené z skóre v mezích náhody, nebo zda se z skóre natolik liší od průměru, že je nepravděpodobné, že by k průměru vzorku došlo náhodou.

Z-test se používá především při standardizovaném testování, kdy se zjišťuje, zda se výsledky určitého vzorku účastníků testu pohybují v rámci standardního výkonu účastníků testu nebo mimo něj.

Podívejme se na použití Z-testu při standardizovaném testování.

Doporučujeme:  Emocionální reakce

V americkém školním obvodu se používá standardizovaný test čtení, který testuje výkony žáků pátých tříd základní školy ve srovnání s národní normou pro žáky pátých tříd. Počet žáků páté třídy této základní školy, kteří se testu účastní, je 55 žáků.

Národní normální skóre testu, tedy populační průměr, je pro tento konkrétní standardizovaný test 100 bodů. Populační směrodatná odchylka pro zkoumaný rok je 12.

Výsledky žáků pátých tříd základní školy v tomto školním obvodu jsou vzorkem celkové populace žáků pátých tříd v USA, kteří se testu také zúčastnili.

Školní obvod se dozví, že průměr pro jeho školu je 96, což je méně než celostátní průměr. Rodiče žáků jsou rozrušeni, když se dozvědí, že jejich škola je v testu čtení pod národní normou. Vedení školního obvodu poukazuje na to, že výsledky testu jsou ve skutečnosti docela blízko populačnímu průměru, i když jsou nižší.

Skutečnou otázkou je, zda je průměrný výsledek testů školy dostatečně nižší než národní norma, aby to znamenalo problém, nebo zda je průměrný výsledek testů školy v přijatelných mezích. To zjistíme pomocí Z-testu.

Nejprve vypočtěte směrodatnou chybu průměru:

Dále vypočtěte z-skóre:

Pamatujte si, že z-skóre je vzdálenost od populačního průměru v jednotkách populační směrodatné odchylky. To znamená, že v našem příkladu je průměrné skóre 96 -2,47 jednotek směrodatné odchylky od populačního průměru. Záporná hodnota znamená, že výběrový průměr je menší než populační průměr. Vzhledem k tomu, že normální křivka je symetrická, je Z tabulka vždy vyjádřena v kladných z skórech, takže pokud je vypočtené z skóre záporné, vyhledejte ho v tabulce, jako by bylo nezáporné.

Dále se podíváme na z-skóre v tabulce Z a zjistíme, že z-skóre -2,47 je 49,32 %. To znamená, že plocha pod normální křivkou mezi průměrem populace a průměrem našeho vzorku je 49,32 %.

Doporučujeme:  Naslouchadla

To nám říká, že 49,32 % plus 50 %, tj. 99,32 % všech možných vzorků žáků stejné velikosti by mělo vyšší průměrné skóre v testu než náš vzorek žáků pátých tříd. Je to proto, že naše z-skóre je záporné, takže jsme pod populačním průměrem. Zahrnujeme tedy nejen vzdálenost mezi průměrem našeho vzorku a průměrem populace, ale také plochu pod normální křivkou, která je větší než průměr populace.

Pokud by průměr našeho vzorku byl 104 a nikoli 96, pak by naše z-skóre bylo 2,47, což by znamenalo, že průměr našeho vzorku byl vyšší než průměr populace. To by znamenalo, že žáci pátých tříd v našem vzorku patří mezi 0,7 % nejlepších žáků v zemi.

Vraťme se však k naší původní otázce. Je nějaký problém s programem čtení na naší základní škole? Naši otázku můžeme přeformulovat tak, že řekneme: Je průměr z naší základní školy, tedy vzorek z celkové populace žáků pátých tříd, natolik mimo normu, že je třeba přijmout nápravné opatření ke zlepšení čtenářského programu?

Vyjádřeme to ve formě hypotézy, kterou budeme testovat pomocí statistické analýzy. Naše hypotéza zní, že průměr našeho vzorku se významně liší od průměru populace a že je nutné přijmout nápravná opatření. Naše nulová hypotéza zní, že rozdíl je způsoben čistě náhodou a žádné opatření není nutné.

Abychom mohli odpovědět na tuto otázku, musíme určit, jakou úroveň spolehlivosti (confidence level) chceme použít. Obvykle se používá hladina spolehlivosti 0,05, což znamená, že pokud je nulová hypotéza pravdivá, máme pouze 5% šanci, že ji přesto zamítneme.

V případě průměru našeho vzorku je z-skóre -2,47, které nám poskytuje hodnotu 49,32 %, což znamená, že 49,32 % plus 49,32 % neboli 98,64 % populace dosáhlo skóre bližšího průměru populace než náš vzorek studentů. Protože náš vzorek je mimo tuto oblast o 1,36 %, musíme nulovou hypotézu zamítnout, protože hodnota 1,36 % je menší než 5 %, což je naše hladina spolehlivosti.

Doporučujeme:  Dyssomnie

Proto jsme s 95% spolehlivostí dospěli k závěru, že výsledky testů žáků v našem vzorku nebyly v mezích normálního rozptylu a že je třeba přijmout nápravná opatření ke zlepšení výsledků testů.

Sprinthall, Richard C. Základy statistické analýzy: Copyright 2003, Pearson Education Group.