Chí-kvadrát test

Nejčastější formou statistiky testu je:

kde slovo „očekávaná“ často neoznačuje očekávanou hodnotu, ale pozorovatelný odhad očekávané hodnoty. Testy poměru pravděpodobnosti však tuto formu nemají.

Test chí-kvadrát je statistický nástroj k oddělení reálných efektů od náhodných odchylek. Lze jej použít na data, která jsou:

Test chí-kvadrát určuje pravděpodobnost náhodného získání pozorovaných výsledků za konkrétní hypotézy. Testuje nezávislost a také dobrotu vhodnosti souboru dat.

Hodnota p (např. p = 0,05). Je to údaj o pravděpodobnosti získání výsledku (0,05 = 5%). Jako takový je poměrně neinformativní. Užitečnější doprovodnou statistikou je phi (nebo Cramerovo phi, nebo Cramerovo V). Phi je míra asociace, která udává hodnotu pro korelaci mezi dvěma dichotomickými proměnnými porovnávanými v testu chí-kvadrát (2 × 2). Tato hodnota udává rozsah vztahu mezi oběma proměnnými. Cramerovo phi lze použít pro ještě větší srovnání. Je to smysluplnější měřítko praktického významu testu chí-kvadrát a udává se jako velikost efektu.

Test chí-kvadrát pro pohotovostní tabulku

Pro testování nulové hypotézy nezávislosti řádků a sloupců může být použit test chí-kvadrát v záložní tabulce.

Spravedlivá mince je taková, u které je stejně pravděpodobné, že se po jejím hodu objeví panna a orel. Dostanete minci a požádáte vás, abyste otestovali, zda je spravedlivá. Po 100 pokusech se hlava otočí 53krát nahoru a orel dopadne 47krát. Zde je analýza chí-kvadrát, kde nulová hypotéza je, že mince je spravedlivá:

Vzhledem k tomu, že existuje jeden (1) stupeň volnosti, p = 0,5485. Existuje tedy 54,85% pravděpodobnost, že se tyto údaje objeví, pokud je mince spravedlivá, což se nepovažuje za statisticky významný důkaz, že mince NENÍ spravedlivá.