Kurtóza

Daleko červené světlo nemá vliv na průměrnou rychlost gravitropní reakce u pšeničných koloptilů, ale mění kurtózu z platykurtické na leptokurtickou (-0,194 → 0,055)

V teorii pravděpodobnosti a statistice je kurtóza měřítkem odlehlého (vzácných, extrémních dat) charakteru pravděpodobnostního rozdělení náhodné veličiny s reálnou hodnotou. Vyšší kurtóza znamená, že existují řídké extrémní odchylky přesahující to, co je předpovězeno normálním rozdělením.

V teorii pravděpodobnosti a statistice je kurtóza (z řeckého κυρτός, kyrtos nebo kurtos, což znamená „zakřivený, obloukovitý“) měřítkem „tailednosti“ pravděpodobnostního rozdělení náhodné veličiny s reálnou hodnotou. Podobně jako pojem šikmosti je kurtóza deskriptorem tvaru pravděpodobnostního rozdělení a stejně jako pro šikmost existují různé způsoby jeho kvantifikace pro teoretické rozdělení a odpovídající způsoby jeho odhadu ze vzorku z populace. V závislosti na konkrétním měřítku kurtózy, které se používá, existují různé interpretace kurtózy a toho, jak by měla být jednotlivá měřítka interpretována.

Standardní míra kurtózy, pocházející od Karla Pearsona, je založena na škálované verzi čtvrtého momentu dat nebo populace. Toto číslo souvisí s koncovkami distribuce, nikoli s jejím vrcholem; proto je někdy viděná charakteristika jako „vrcholovost“ mylná. U tohoto měřítka je vyšší kurtóza výsledkem málo častých extrémních odchylek (nebo odlehlých hodnot), na rozdíl od častých mírně velkých odchylek.

Kurtóza jakéhokoliv jednorozměrného normálního rozdělení je 3. Je běžné porovnávat kurtózu rozdělení s touto hodnotou. Distribuce s kurtózou menší než 3 jsou prý platykurtické, i když to neznamená, že rozdělení je „ploché“, jak se někdy uvádí. Spíše to znamená, že rozdělení produkuje méně a méně extrémních odlehlých hodnot než normální rozdělení. Příkladem platykurtického rozdělení je rovnoměrné rozdělení, které neprodukuje odlehlé hodnoty. Distribuce s kurtózou větší než 3 jsou prý leptokurtické. Příkladem leptokurtického rozdělení je Laplaceovo rozdělení, které má ocasy, které se asymptoticky blíží k nule pomaleji než Gaussovo, a proto produkuje více odlehlých hodnot než normální rozdělení. Je také běžnou praxí používat upravenou verzi Pearsonovy kurtózy, přebytečnou kurtózu, což je kurtóza minus 3, pro srovnání s normálním rozdělením. Někteří autoři používají „kurtózu“ samotnou pro označení přebytečné kurtózy. Z důvodu srozumitelnosti a obecnosti se však tento článek řídí konvencí o nepřevyšování a výslovně uvádí, kde je myšlena přebytečná kurtóza.

Doporučujeme:  Zuby (anatomie)

Alternativní měřítka kurtózy jsou: L-kurtóza, což je škálovaná verze čtvrtého L-momentu; měřítka založená na čtyřech populačních nebo výběrových kvantilech. Ty jsou analogické k alternativním měřítkům šikmosti, které nejsou založeny na obyčejných momentech.
Čtvrtý standardizovaný moment je definován jako μ4 / σ4, kde μ4 je čtvrtý moment o průměru a σ je směrodatná odchylka. Ta je někdy používána jako definice kurtózy ve starších dílech, ale není definicí používanou zde.

Kurtóza je běžněji definována jako čtvrtý kumulát dělený druhou mocninou rozptylu pravděpodobnostního rozdělení,

který je známý jako nadměrná kurtóza. „minus 3“ na konci tohoto vzorce je často vysvětleno jako korekce, aby se kurtóza normálního rozdělení rovnala nule. Další důvod lze vidět při pohledu na vzorec pro kurtózu součtu náhodných proměnných. Vzhledem k použití kumulátoru, pokud Y je součet n nezávislých náhodných proměnných, všechny se stejným rozdělením jako X, pak Kurt[Y] = Kurt[X] / n, zatímco vzorec by byl složitější, kdyby kurtóza byla definována jako μ4 / σ4.

Obecněji, pokud X1, …, Xn jsou nezávislé náhodné proměnné, které mají všechny stejný rozptyl, pak

zatímco tato identita by neobstála, pokud by definice nezahrnovala odečtení 3.

Vysoká distribuce kurtózy má ostřejší „vrchol“ a tučnější „ocasy“, zatímco nízká distribuce kurtózy má zaoblenější vrchol se širšími „rameny“.

Distribuce s pozitivní kurtózou se nazývá leptokurtická neboli leptokurtotická. Z hlediska tvaru má leptokurtická distribuce akutnější „vrchol“ kolem průměru (to znamená vyšší pravděpodobnost hodnot blízkých průměru než normálně distribuovaná proměnná) a „tukových ohonů“ (to znamená vyšší pravděpodobnost extrémních hodnot než normálně distribuovaná proměnná). Příklady leptokurtických distribucí zahrnují Laplaceovo rozdělení a logistické rozdělení.

Distribuce se zápornou kurtózou se nazývá platykurtická neboli platykurtotická. Z hlediska tvaru má platykurtická distribuce menší „vrchol“ kolem průměru (to znamená nižší pravděpodobnost hodnot blízkých průměru než normálně distribuovaná veličina) a „tenký ohon“ (to znamená nižší pravděpodobnost extrémních hodnot než normálně distribuovaná veličina). Příklady platykurtických distribucí zahrnují spojité nebo diskrétní rovnoměrné distribuce a zvýšené kosinové rozdělení. Nejvíce platykurtické rozdělení ze všech je Bernoulliho rozdělení s p = ½ (například počet, kolikrát člověk dostane „pannu“ při hodu mincí jednou), pro které je kurtóza -2.

Doporučujeme:  Psi

Rodina Pearsonů typu VII

pdf pro Pearsonovu distribuci typu VII s kurtózou nekonečna (červená); 2 (modrá); a 0 (černá)

log-pdf pro Pearsonovu distribuci typu VII s kurtózou nekonečna (červená); 2 (modrá); 1, 1/2, 1/4, 1/8 a 1/16 (šedá); a 0 (černá)

Účinky kurtózy ilustrujeme pomocí parametrické rodiny distribucí, jejichž kurtóza může být upravena, zatímco jejich momenty nižšího řádu a kumulace zůstávají konstantní. Vezměme si rodinu Pearsonů typu VII, což je zvláštní případ rodiny Pearsonů typu IV omezené na symetrické hustoty. Funkce hustoty pravděpodobnosti je dána

kde a je parametr měřítka a m je parametr tvaru.

Všechny hustoty v této rodině jsou symetrické. kth moment existuje za předpokladu . Pro kurtóza existovat, požadujeme . Pak průměr a šikmost existují a oba jsou identicky nulové. Nastavení dělá rozptyl rovná jednotě. Pak jediný volný parametr je m, který řídí čtvrtý moment (a kumulativní) a proto kurtóza. Jeden může reparameterizovat s , Kde je kurtóza jak je definováno výše. To dává jeden-parametr leptokurtic rodina s nulovým průměrem, jednotková rozptyl, nulová šikmost, a svévolné pozitivní kurtóza. Přeprogramované hustota je

V limitě jako jeden získá hustotu

který je zobrazen jako červená křivka na obrázcích vpravo.

V opačném směru jako jedna získává standardní normální hustotu jako limitující rozdělení, zobrazené jako černá křivka.

Kurtóza známých distribucí

V tomto příkladu porovnáme několik dobře známých rozdělení z různých rodin parametrů. Všechny hustoty, o kterých se zde uvažuje, jsou unimodální a symetrické. Každý z nich má průměr a vychýlenost nula. Parametry byly zvoleny tak, aby v každém případě vyústily v rozptyl jednoty. Obrázky vpravo ukazují křivky pro následujících sedm hustot, na lineární stupnici a logaritmické stupnici:

Všimněte si, že v tomto případě mají platykurtické hustoty ohraničenou podporu, zatímco hustoty s nezápornou kurtózou jsou podporovány na celé reálné přímce. Obecně existují platykurtické hustoty s nekonečnou podporou, například rozdělení exponenciální síly s dostatečně velkým tvarovým parametrem b.

Doporučujeme:  Abraham Maslow

Pro vzorek n hodnot je vzorek kurtózy

kde m4 je čtvrtý výběrový moment o průměru, m2 je druhý výběrový moment o průměru (tedy rozptyl vzorku), xi je ith hodnota a je výběrový průměr.

používá se také, kde n – velikost vzorku, D – vypočtená odchylka, xi – hodnota x’tého měření a – vypočtený aritmetický průměr.

Odhadci populační kurtózy

Vzhledem k podmnožině vzorků z populace je výše uvedený vzorek kurtózy zkresleným odhadem populační kurtózy. Obvyklý odhad populační kurtózy (používaný v SAS, SPSS a Excelu, ale nikoli v MINITAB nebo BMDP) je G2, definovaný takto:

kde k4 je jedinečný symetrický nezkreslený odhad čtvrtého kumulátu, k2 je nezkreslený odhad populačního rozptylu, m4 je čtvrtý výběrový moment o průměru, m2 je rozptyl vzorku, xi je ith hodnota a je výběrový průměr. Bohužel je sám o sobě obecně zkreslený. Pro normální rozdělení je nezkreslený, protože jeho očekávaná hodnota je pak nulová.