V teorii pravděpodobnosti a statistice je rozdělení chí-kvadrát (také rozdělení chí-kvadrát), nebo χ2 rozdělení, jedním z teoretických rozdělení pravděpodobnosti, které se nejvíce používá v inferentiální statistice, tj. ve statistických testech významnosti. Je užitečné, protože za rozumných předpokladů lze snadno vypočteným veličinám dokázat, že mají rozdělení, která se blíží rozdělení chí-kvadrát, pokud je nulová hypotéza pravdivá.
Pokud jsou k nezávislé, normálně distribuované náhodné proměnné s průměry a odchylkami , pak statistika
je distribuován podle rozdělení chí-kvadrát. To je obvykle psáno
Distribuce chí-kvadrát má jeden parametr: – kladné celé číslo, které určuje počet stupňů volnosti (tj. počet )
Distribuce chí-kvadrát je zvláštním případem distribuce gama.
Nejznámějšími situacemi, ve kterých se rozdělení chí-kvadrát používá, jsou běžné testy chí-kvadrát na zdatnost vhodnosti pozorovaného rozdělení na teoretické a na nezávislost dvou kritérií klasifikace kvalitativních dat. Nicméně mnoho dalších statistických testů vede k použití tohoto rozdělení, například Friedmanova analýza rozptylu podle řad.
Funkce hustoty pravděpodobnosti chí-kvadrát je
kde a pro .
Zde označuje funkci Gama.
Kumulativní distribuční funkce je:
kde je neúplná funkce Gama.
Tabulky tohoto rozdělení – obvykle v kumulativní podobě – jsou široce dostupné (pro online verze viz externí odkazy níže) a funkce je obsažena v mnoha tabulkách (například OpenOffice.org calc nebo Microsoft Excel) a všech statistických balíčcích.
Jsou-li na tyto proměnné uvaleny nezávislé lineární homogenní mantinely, rozdělení podmíněné těmito mantinely je , Odůvodnění pojmu „stupně volnosti“.
Charakteristická funkce rozdělení Chi-kvadrát je
Distribuce chí-kvadrát má četné využití v inferentiálních statistikách, například v testech chí-kvadrát a v odhadech rozptylů.
Vstupuje do problému odhadu průměru normálně rozložené populace a do problému odhadu sklonu regresní přímky prostřednictvím své role ve Studentově t-rozdělení.
Vstupuje do veškeré analýzy problémů rozptylu prostřednictvím své role v F-rozdělení, což je rozdělení poměru dvou nezávislých náhodných proměnných chí-kvadrát vydělených jejich příslušnými stupni volnosti.
Pokud , Pak jako tendenci k nekonečnu, distribuce tendenci k normality.
Nicméně, tendence je pomalý (skewness je a kurtosis ) a dvě transformace jsou běžně považovány, z nichž každý se blíží normality rychleji než sám:
Fisher ukázal, že je přibližně normálně distribuován se střední a jednotkovou odchylkou.
Wilson a Hilferty ukázalo v roce 1931, že je přibližně běžně distribuovány s průměrem a rozptylem.
Očekávaná hodnota náhodné proměnné s rozdělením chí-kvadrát se stupni volnosti je a rozptyl je .
Medián je dán přibližně podle
Všimněte si, že 2 stupně volnosti vedou k exponenciálnímu rozdělení.
Informační entropie je dána:
kde je funkce Digamma.