Cramér’s V

Ve statistice je Cramérův V (někdy označovaný jako Cramérovo phi nebo Cramersovo C a označovaný jako φc) populární[citace potřebná] míra asociace mezi dvěma nominálními proměnnými, která udává hodnotu mezi 0 a +1 (včetně). Je založena na Pearsonově chí-kvadrát statistice a byla publikována Haraldem Cramérem v roce 1946.

φc je vzájemná korelace dvou diskrétních proměnných a lze ji použít u proměnných, které mají dvě nebo více úrovní. φc je symetrická míra, nezáleží na tom, kterou proměnnou umístíme do sloupců a kterou do řádků. Nezáleží ani na pořadí řádků/sloupců, takže φc lze použít s nominálními nebo vyššími typy dat (uspořádanými, číselnými atd.).

Cramérův V lze použít i pro modely chí-kvadrát dobré shody, pokud existuje tabulka 1×k (např.: r=1). V tomto případě se k bere jako počet volitelných výsledků a funguje jako míra tendence k jednomu výsledku.

Cramérova V se pohybuje od 0 (což odpovídá nulové asociaci mezi proměnnými) do 1 (úplná asociace) a může dosáhnout hodnoty 1 pouze tehdy, když se obě proměnné navzájem rovnají.

φc2 je střední kvadratická kanonická korelace mezi proměnnými[citace potřebná].

V případě kontingenční tabulky 2×2 se Cramérovo V rovná koeficientu Phi.

Všimněte si, že vzhledem k tomu, že hodnoty chí-kvadrátu mají tendenci růst s počtem buněk, čím větší je rozdíl mezi r (řádky) a c (sloupce), tím větší je pravděpodobnost, že φc bude mít tendenci k hodnotě 1, aniž by existoval silný důkaz významné korelace.[potřebná citace]

Cramérův V se vypočítá jako druhá odmocnina statistiky chí-kvadrát vydělená velikostí vzorku a délkou minimální dimenze (k je menší z počtu řádků r nebo sloupců c).

Vzorec pro koeficient φc je následující:

Hodnota p pro významnost φc je stejná, jaká se vypočítá pomocí Pearsonova chí-kvadrát testu [citace potřebná].

Vzorec pro rozptyl φc je znám.

Na rozdíl od kontingenční tabulky je hodnota V relativně nezávislá na počtu sloupců nebo řádků.

Další míry korelace pro nominální data:

Průměr (aritmetický, geometrický) – Medián – Modus – Výkon – Rozptyl – Směrodatná odchylka

Testování hypotéz – Významnost – Nulová hypotéza / Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu

Funkce přežití – Kaplan-Meierův test – Logrankův test – Míra selhání – Modely proporcionálních rizik

Normální (zvonová křivka) – Poissonova – Bernoulliho

Zkreslující proměnná – Pearsonův korelační koeficient součinu a momentu – Korelace pořadí (Spearmanův korelační koeficient pořadí, Kendallův korelační koeficient pořadí tau)

Lineární regrese – Nelineární regrese – Logistická regrese