Paretova distribuce

Paretovo rozdělení, pojmenované po italském ekonomovi Vilfredu Paretovi, je pravděpodobnostní rozdělení podle mocenského práva, které se kryje se sociálními, vědeckými a mnoha dalšími typy pozorovatelných jevů. Mimo oblast ekonomie je někdy označováno jako Bradfordovo rozdělení.

Je-li X náhodná proměnná s Paretovým (Typ I) rozdělením, pak pravděpodobnost, že X je větší než nějaké číslo x, je dána

kde xm je (nutně kladná) minimální možná hodnota X a α je kladný parametr. Rodina Paretových distribucí je parametrizována dvěma veličinami, xm a α. Když se toto rozdělení používá k modelování rozdělení bohatství, pak se parametr α nazývá Paretův index.

Kumulativní distribuční funkce

Z definice vyplývá, že kumulativní distribuční funkce Paretovy náhodné proměnné s parametry α a xm je

Při vynesení na lineárních osách rozdělení předpokládá známou křivku ve tvaru J, která se asymptoticky přibližuje ke každé z ortogonálních os. Všechny segmenty křivky jsou sobě podobné (s výhradou vhodných škálovacích faktorů).

Při vynesení na logaritmické stupnici (obě osy logaritmické) je rozdělení reprezentováno přímkou.

Funkce hustoty pravděpodobnosti

Z toho vyplývá (diferenciací), že hustota pravděpodobnosti funkce je

Momenty a charakteristická funkce

Diracova delta funkce je omezujícím případem Paretovy hustoty:

Podmíněné rozdělení pravděpodobnosti Paretovo-distribuované náhodné veličiny, vzhledem k tomu, že je větší nebo rovno konkrétnímu číslu x1 přesahujícímu xm, je Paretovo rozdělení se stejným Paretovým indexem α, ale s minimem x1 místo xm.

Charakterizační věta

Předpokládejme, že Xi, i = 1, 2, 3, … jsou nezávislé náhodné proměnné, jejichž rozdělení pravděpodobnosti je podporováno na intervalu [xm, ∞) pro některé xm >0. Předpokládejme, že pro všechna n jsou dvě náhodné proměnné min{ X1, …, Xn } a (X1 + … + Xn)/min{ X1, …, Xn } nezávislé. Pak je společné rozdělení Paretovo rozdělení.

Pareto původně používal toto rozdělení k popisu rozdělení bohatství mezi jednotlivci, protože se zdálo, že ukazuje poměrně dobře způsob, jakým je větší část bohatství jakékoli společnosti vlastněna menším procentem lidí v této společnosti. Používal ho také k popisu rozdělení příjmů. Tato myšlenka je někdy vyjádřena jednodušeji jako Paretův princip nebo „pravidlo 80-20“, které říká, že 20% populace kontroluje 80% bohatství. Nicméně pravidlo 80-20 odpovídá určité hodnotě α a ve skutečnosti Paretovy údaje o britských daních z příjmu v jeho Cours d’économie politique naznačují, že asi 30% populace mělo asi 70% příjmu. Graf hustoty pravděpodobnosti (PDF) na začátku tohoto článku ukazuje, že „pravděpodobnost“ nebo zlomek populace, která vlastní malé množství bohatství na osobu, je poměrně vysoká a pak se trvale snižuje s rostoucím bohatstvím. Toto rozdělení se neomezuje na popis bohatství nebo příjmů, ale na mnoho situací, ve kterých je nalezena rovnováha v rozdělení „malého“ na „velkého“. Následující příklady jsou někdy viděny jako přibližně Paretovo rozdělení:

Doporučujeme:  MELAS syndrom

Vybavená kumulativní Paretova distribuce s maximálními jednodenními srážkami pomocí CumFreq

Vztah k jiným distribucím

Vztah k exponenciálnímu rozdělení

Paretovo rozdělení souvisí s exponenciálním rozdělením následovně. Je-li X Paretovo rozdělení s minimem xm a indexem α, pak

je exponenciálně distribuován s intenzitou (rychlostní parametr) α. Ekvivalentně, pokud je Y exponenciálně distribuován s intenzitou α, pak

je Pareto-distribuován s minimem xm a indexem α.

Posledním výrazem je kumulativní distribuční funkce exponenciálního rozdělení s intenzitou α.

Vztah k logaritmicko-normálnímu rozdělení

Všimněte si, že Paretovo rozdělení a logaritmicko-normální rozdělení jsou alternativní rozdělení pro popis stejných typů veličin. Jedno ze spojení mezi nimi je, že jsou to obě rozdělení exponenciálních náhodných veličin rozdělených podle jiných společných rozdělení, respektive exponenciální rozdělení a normální rozdělení. (Obě dvě posledně jmenovaná rozdělení jsou „základní“ v tom smyslu, že logaritmy jejich hustotních funkcí jsou lineární a kvadratické, respektive funkce pozorovaných hodnot.)[citace nutná]

Vztah k generalizované Paretově distribuci

Paretovo rozdělení je zvláštním případem zobecněného Paretova rozdělení, což je rodina distribucí podobné formy, ale obsahující navíc parametr tak, že podpora rozdělení je buď ohraničena níže (v proměnném bodě), nebo ohraničena jak nahoře, tak dole (kde jsou obě proměnné), přičemž Lomaxovo rozdělení je zvláštním případem. Tato rodina také obsahuje jak neřízené, tak posunuté exponenciální rozdělení.

Paretova rozdělení jsou spojitá rozdělení pravděpodobnosti. Zipfův zákon, také někdy nazývaný zeta rozdělení, může být považován za diskrétní protějšek Paretova rozdělení.

Vztah k „Paretově zásadě“

„Zákon 80-20“, podle kterého 20% všech lidí dostává 80% všech příjmů a 20% nejbohatších 20% dostává 80% z těchto 80% a tak dále, platí právě tehdy, když je Paretův index α = log45, přibližně 1,161. Navíc bylo prokázáno, že následující jsou matematicky ekvivalentní:

To se netýká pouze příjmu, ale také bohatství nebo čehokoli jiného, co lze modelovat tímto rozdělením.

Doporučujeme:  Samoléčba

To vylučuje Paretova rozdělení, ve kterých 0 < α ≤ 1, která, jak je uvedeno výše, mají nekonečnou očekávanou hodnotu, a tak nemohou rozumně modelovat rozdělení příjmů.

Lorenzovy křivky pro řadu Paretových distribucí. Případ α = ∞ odpovídá dokonale rovnému rozdělení (G = 0) a řádek α = 1 odpovídá úplné nerovnosti (G = 1)

Lorenzova křivka je často používána k charakterizaci rozdělení příjmů a bohatství. Pro jakékoliv rozdělení je Lorenzova křivka L(F) napsána ve smyslu PDF ƒ nebo CDF F jako

kde x(F) je inverzní k CDF. Pro Paretovo rozdělení,

a Lorenzova křivka je vypočtena jako

kde α musí být větší nebo rovno jednotce, protože jmenovatel ve výrazu pro L(F) je jen střední hodnota x. Příklady Lorenzovy křivky pro řadu Paretových rozdělení jsou uvedeny v grafu vpravo.

Giniho koeficient je míra odchylky Lorenzovy křivky od přímky rovnovážného rozdělení, což je přímka spojující [0, 0] a [1, 1], která je zobrazena černě (α = ∞) na Lorenzově grafu vpravo. Konkrétně je Giniho koeficient dvojnásobkem plochy mezi Lorenzovou křivkou a přímkou rovnovážného rozdělení. Giniho koeficient pro Paretovo rozdělení se pak vypočítá jako

Pravděpodobnostní funkce pro Paretovy distribuční parametry α a xm při vzorku x = (x1, x2, …, xn) je

Proto logaritmická funkce pravděpodobnosti je

Je možné vidět, že je monotónně rostoucí s , To znamená, že tím větší hodnota , Tím větší hodnota pravděpodobnosti funkce. Proto, protože , Dospěli jsme k závěru, že

Abychom našli odhad pro α, vypočteme odpovídající parciální derivaci a určíme, kde je nula:

Odhad maximální pravděpodobnosti pro α je tedy:

Očekávaná statistická chyba je:

Charakteristické zakřivené ‚long tail‘ rozdělení při vynesení na lineární stupnici, maskuje základní jednoduchost funkce při vynesení na log-log grafu, který pak má podobu přímky se záporným gradientem.[citace nutná]

Generování náhodného vzorku z Paretovy distribuce

Náhodné vzorky mohou být generovány pomocí inverzního transformačního vzorkování. Za předpokladu náhodné proměnné U odebrané z rovnoměrného rozdělení na jednotkovém intervalu (0,1), je proměnná T dána

Doporučujeme:  Feromony

je Pareto-distribuováno.[citace nutná] Pokud je U rovnoměrně distribuováno na [0, 1), může být vyměněno za (1 – U).

Bounded Paretova distribuce

umístění (skutečné)
tvar (skutečné)

Ohraničené Paretovo rozdělení nebo zkrácené Paretovo rozdělení má tři parametry α, L a H. Stejně jako ve standardním Paretově rozdělení α určuje tvar. L označuje minimální hodnotu a H označuje maximální hodnotu.
(Variance v tabulce vpravo by měla být interpretována jako 2. moment).

Funkce hustoty pravděpodobnosti je

kde L ≤ x ≤ H a α > 0.

Generování ohraničených Paretových náhodných proměnných

Pokud je U rovnoměrně rozloženo na
(0, 1), pak

je ohraničen Pareto-distribuován.[citace nutná]

Symetrická Paretova distribuce

Symetrické Paretovo rozdělení lze definovat funkcí hustoty pravděpodobnosti:

Má podobný tvar jako Paretovo rozdělení, zatímco vypadá jako obrácené Paretovo rozdělení pro [citace nutná].