Rozdělení pravděpodobnosti

Rozdělení pravděpodobnosti popisuje hodnoty a pravděpodobnosti, že náhodná událost může nastat. Hodnoty musí pokrývat všechny možné výsledky události, zatímco celková pravděpodobnost musí být sečtena přesně na 1, nebo 100%. Například hod jedinou mincí může mít hodnoty Panna nebo orel s pravděpodobností přesně 1/2 pro každou; tyto dvě hodnoty a dvě pravděpodobnosti tvoří rozdělení pravděpodobnosti události hodu jedinou mincí. Toto rozdělení se nazývá diskrétní rozdělení, protože existuje spočitatelný počet diskrétních výsledků s kladnou pravděpodobností.

Souvislé rozdělení popisuje události v souvislém rozsahu, kde pravděpodobnost konkrétního výsledku je nulová. Například šipka vržená na terč má v podstatě nulovou pravděpodobnost přistání v určitém bodě, protože bod je mizivě malý, ale má určitou pravděpodobnost přistání v dané oblasti. Pravděpodobnost přistání v malé oblasti terče by (doufejme) byla větší než přistání na odpovídající oblasti jinde na desce. Hladká funkce, která popisuje pravděpodobnost přistání kdekoli na terči, je rozdělení pravděpodobnosti události vržení šipky. Integrál funkce hustoty pravděpodobnosti (pdf) po celé oblasti terče (a snad i zdi, která ho obklopuje) musí být roven 1, protože každá šipka musí někde přistát.

Pojem rozdělení pravděpodobnosti a náhodných veličin, které popisují, je základem matematické disciplíny teorie pravděpodobnosti a vědy o statistice. Rozšíření nebo variabilita je téměř v každé hodnotě, kterou lze měřit v populaci (např. výška lidí, životnost kovu atd.); téměř všechna měření se provádějí s nějakou vnitřní chybou; ve fyzice je mnoho procesů popsáno pravděpodobnostně, od kinetických vlastností plynů až po kvantově mechanický popis základních částic. Z těchto a mnoha dalších důvodů jsou jednoduchá čísla často nedostatečná pro popis veličiny, zatímco rozdělení pravděpodobnosti jsou často vhodnějšími modely. Existují však značné matematické komplikace při manipulaci s rozdělením pravděpodobnosti, protože většinu standardních aritmetických a algebraických manipulací nelze použít.

Doporučujeme:  Zneužití statistik

V teorii pravděpodobnosti může být každá náhodná veličina přiřazena funkci definované ve stavovém prostoru vybaveném pravděpodobnostním rozložením, které přiřazuje pravděpodobnost každé podmnožině (přesněji každé měřitelné podmnožině) svého stavového prostoru tak, aby byly splněny axiomy pravděpodobnosti. To znamená, že rozdělení pravděpodobnosti jsou míry pravděpodobnosti definované ve stavovém prostoru místo ve výběrovém prostoru. Náhodná veličina pak definuje míru pravděpodobnosti ve výběrovém prostoru přiřazením podmnožiny výběrového prostoru pravděpodobnosti jejího inverzního obrazu ve stavovém prostoru. Jinými slovy, rozdělení pravděpodobnosti náhodné veličiny je míra posunu rozdělení pravděpodobnosti ve stavovém prostoru.

Pravděpodobnostní rozdělení náhodných veličin s reálnou hodnotou

Protože rozdělení pravděpodobnosti Pr na reálné přímce je určeno pravděpodobností, že se nachází v polootevřeném intervalu Pr(a, b], rozdělení pravděpodobnosti náhodné proměnné X oceněné reálnou hodnotou je kompletně charakterizováno její kumulativní distribuční funkcí:

Diskrétní rozdělení pravděpodobnosti

Rozdělení pravděpodobnosti se nazývá diskrétní, pokud se jeho kumulativní distribuční funkce zvyšuje pouze skokově.

Množina všech hodnot, které může diskrétní náhodná proměnná s nenulovou pravděpodobností předpokládat, je buď konečná, nebo nespočetně nekonečná, protože součet nespočetně mnoha kladných reálných čísel (což je nejmenší horní mez množiny všech konečných parciálních součtů) se vždy odchyluje do nekonečna. Množina možných hodnot je obvykle topologicky diskrétní v tom smyslu, že všechny její body jsou izolované body. Existují však diskrétní náhodné proměnné, pro které je tato spočetná množina na reálné přímce hustá.

Diskrétní rozdělení jsou charakterizovány pravděpodobnostní hmotnostní funkce, taková, že

Kontinuální rozdělení pravděpodobnosti

Podle jedné konvence se pravděpodobnostní rozdělení nazývá spojité, pokud je jeho kumulativní distribuční funkce spojitá, což znamená, že patří k náhodné proměnné X, pro kterou Pr[ X = x ] = 0 pro všechna x v R.

Jiná konvence vyhrazuje pojem kontinuální rozdělení pravděpodobnosti pro absolutně kontinuální rozdělení. Tato rozdělení mohou být charakterizována funkcí hustoty pravděpodobnosti: nezápornou Lebesgueovou integrální funkcí definovanou na reálných číslech tak, že

Doporučujeme:  William Ickes

Diskrétní distribuce a některé spojité distribuce (jako ďáblovo schodiště) takovou hustotu nepřipouštějí.

Podpora rozdělení je nejmenší uzavřená množina, jejíž doplněk má nulovou pravděpodobnost.

Pravděpodobnostní rozdělení součtu dvou nezávislých náhodných veličin je konvoluce každého jejich rozdělení.

Pravděpodobnostní rozdělení rozdílu dvou náhodných veličin je křížová korelace každého z jejich rozdělení.

Diskrétní náhodná veličina je náhodná veličina, jejíž rozdělení pravděpodobnosti je diskrétní. Podobně spojitá náhodná veličina je náhodná veličina, jejíž rozdělení pravděpodobnosti je spojité.

Seznam důležitých rozdělení pravděpodobnosti

Určité náhodné proměnné se v teorii pravděpodobnosti vyskytují velmi často, v některých případech kvůli jejich aplikaci na mnoho přírodních a fyzikálních procesů a v některých případech kvůli teoretickým důvodům, jako je centrální limitní věta, Poissonova limitní věta nebo vlastnosti, jako je memorylessnost nebo jiné charakteristiky. Jejich rozdělení proto získala v teorii pravděpodobnosti zvláštní význam.

Podporováno na ohraničeném intervalu

souvislé rovnoměrné rozložení

Podporováno v polonekonečných intervalech, obvykle [0,∞)

Podporováno na celé reálné lince

Pro každou množinu nezávislých náhodných veličin je hustota pravděpodobnosti jejich společného rozdělení součinem jejich jednotlivých hustoty funkcí.

Dvě nebo více náhodných proměnných ve stejném výběrovém prostoru

Distribuce oceněné maticí

Různá rozdělení

Průměr (Aritmetika, Geometrie) – Medián – Režim – Výkon – Odchylka – Směrodatná odchylka

Testování hypotéz – Význam – Nullova hypotéza/Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu

Funkce přežití – Kaplan-Meier – Logrank test – Četnost selhání – Proporcionální modely nebezpečnosti

Normal (zvonová křivka) – Poisson – Bernoulli

Matoucí veličina – Pearsonův korelační koeficient produktového momentu – Rank korelace (Spearmanův korelační koeficient hodnosti, Kendall tau korelační koeficient hodnosti)

Doporučujeme:  Chaffinch

Lineární regrese – Nelineární regrese – Logistická regrese