Kumulativní distribuční funkce

V teorii pravděpodobnosti funkce kumulativního rozdělení (zkráceně cdf) zcela popisuje rozdělení pravděpodobnosti náhodné veličiny s reálnou hodnotou, X. Pro každé reálné číslo x je cdf dáno

kde pravá strana reprezentuje pravděpodobnost, že náhodná proměnná X nabude hodnoty menší nebo
rovné x. Pravděpodobnost, že X leží v intervalu (a, b), je tedy F(b) − F(a), pokud a < b. Je obvyklé používat pro kumulativní distribuční funkci velké F, na rozdíl od malých písmen f používaných pro funkce hustoty pravděpodobnosti a funkce hmotnosti pravděpodobnosti.

Všimněte si, že ve výše uvedené definici by mohlo být znaménko „méně nebo rovno“, „≤“ nahrazeno znaménkem „striktně méně“ „<“. To by přineslo jinou funkci, ale kterákoli z těchto dvou funkcí může být snadno odvozena od druhé. Jediné, co je třeba si zapamatovat, je držet se jedné z těchto definic, protože jejich smíchání povede k nesprávným výsledkům. V anglicky mluvících zemích se téměř vždy používá konvence, která používá slabou nerovnost (≤) spíše než přísnou nerovnost (<).

„Bodová pravděpodobnost“, že X je přesně b lze nalézt jako

Doplňková kumulativní distribuční funkce

Někdy je užitečné studovat opačnou otázku a ptát se, jak často je náhodná proměnná nad určitou úrovní. Tomu se říká komplementární kumulativní distribuční funkce (CCDF), definovaná jako

Například předpokládejme, že X je rovnoměrně rozloženo v jednotkovém intervalu [0, 1].
Pak je cdf dáno

Pro jiný příklad předpokládejme, že X bere pouze hodnoty 0 a 1, se stejnou pravděpodobností.
Pak cdf je dáno

Každá kumulativní distribuční funkce F je (ne nutně striktně) monotónní rostoucí a spojitá zprava (zprava spojitá). Dále máme a . Každá funkce s těmito čtyřmi vlastnostmi je cdf. Téměř všechny cdfs jsou kadlagové funkce.

Je-li cdf F z X je spojitá, pak X je spojitá náhodná proměnná; je-li dále F je absolutně spojitá, pak existuje Lebesgueův-integrální funkce f (x) taková, že

Doporučujeme:  Čtení pro zvláštní potřeby

pro všechna reálná čísla a a b. (První ze dvou výše zobrazených rovnic by obecně nebyla správná, kdybychom neřekli, že rozdělení je spojité. Kontinuita rozdělení znamená, že P(X = a) = P(X = b) = 0, takže rozdíl mezi „<" a "≤" přestává být v tomto kontextu důležitý.) Funkce f se téměř všude rovná derivaci F a nazývá se funkce hustoty pravděpodobnosti rozdělení X.

Kolmogorovův-Smirnovův test je založen na kumulativních distribučních funkcích a může být použit k testování, zda jsou dvě empirická rozdělení odlišná nebo zda je empirické rozdělení odlišné od ideálního rozdělení. Úzce související Kuiperův test (vyslovuje se /kœypəʁ/; trochu jako „Cowper“ by se mohlo vyslovovat v angličtině) je užitečný, pokud je doména rozdělení cyklická jako v den v týdnu. Například bychom mohli použít Kuiperův test, abychom zjistili, zda se počet tornád mění během roku nebo zda se prodej výrobku mění podle dne v týdnu nebo dne v měsíci.