Rozdělení chí-kvadrát

V teorii pravděpodobnosti a statistice je rozdělení chí-kvadrát (také rozdělení chí-kvadrát), nebo χ2  rozdělení, jedním z teoretických rozdělení pravděpodobnosti, které se nejvíce používá v inferentiální statistice, tj. ve statistických testech významnosti. Je užitečné, protože za rozumných předpokladů lze snadno vypočteným veličinám dokázat, že mají rozdělení, která se blíží rozdělení chí-kvadrát, pokud je nulová hypotéza pravdivá.

Pokud jsou k nezávislé, normálně distribuované náhodné proměnné s průměry a odchylkami , pak statistika

je distribuován podle rozdělení chí-kvadrát. To je obvykle psáno

Distribuce chí-kvadrát má jeden parametr: – kladné celé číslo, které určuje počet stupňů volnosti (tj. počet )

Distribuce chí-kvadrát je zvláštním případem distribuce gama.

Nejznámějšími situacemi, ve kterých se rozdělení chí-kvadrát používá, jsou běžné testy chí-kvadrát na zdatnost vhodnosti pozorovaného rozdělení na teoretické a na nezávislost dvou kritérií klasifikace kvalitativních dat. Nicméně mnoho dalších statistických testů vede k použití tohoto rozdělení, například Friedmanova analýza rozptylu podle řad.

Funkce hustoty pravděpodobnosti chí-kvadrát je

kde a pro .
Zde označuje funkci Gama.
Kumulativní distribuční funkce je:

kde je neúplná funkce Gama.

Tabulky tohoto rozdělení – obvykle v kumulativní podobě – jsou široce dostupné (pro online verze viz externí odkazy níže) a funkce je obsažena v mnoha tabulkách (například OpenOffice.org calc nebo Microsoft Excel) a všech statistických balíčcích.

Jsou-li na tyto proměnné uvaleny nezávislé lineární homogenní mantinely, rozdělení podmíněné těmito mantinely je , Odůvodnění pojmu „stupně volnosti“.
Charakteristická funkce rozdělení Chi-kvadrát je

Distribuce chí-kvadrát má četné využití v inferentiálních statistikách, například v testech chí-kvadrát a v odhadech rozptylů.
Vstupuje do problému odhadu průměru normálně rozložené populace a do problému odhadu sklonu regresní přímky prostřednictvím své role ve Studentově t-rozdělení.
Vstupuje do veškeré analýzy problémů rozptylu prostřednictvím své role v F-rozdělení, což je rozdělení poměru dvou nezávislých náhodných proměnných chí-kvadrát vydělených jejich příslušnými stupni volnosti.

Doporučujeme:  Dvoufázové

Pokud , Pak jako tendenci k nekonečnu, distribuce tendenci k normality.
Nicméně, tendence je pomalý (skewness je a kurtosis ) a dvě transformace jsou běžně považovány, z nichž každý se blíží normality rychleji než sám:

Fisher ukázal, že je přibližně normálně distribuován se střední a jednotkovou odchylkou.

Wilson a Hilferty ukázalo v roce 1931, že je přibližně běžně distribuovány s průměrem a rozptylem.

Očekávaná hodnota náhodné proměnné s rozdělením chí-kvadrát se stupni volnosti je a rozptyl je .
Medián je dán přibližně podle

Všimněte si, že 2 stupně volnosti vedou k exponenciálnímu rozdělení.

Informační entropie je dána:

kde je funkce Digamma.