Průměrný rozdíl

Průměrný rozdíl je míra statistického rozptylu rovnající se průměrnému absolutnímu rozdílu dvou nezávislých hodnot odvozených z rozdělení pravděpodobnosti. Související statistika je relativní průměrný rozdíl, což je průměrný rozdíl dělený aritmetickým průměrem. Důležitý vztah je, že relativní průměrný rozdíl je roven dvojnásobku Giniho koeficientu, který je definován Lorenzovou křivkou.

Průměrný rozdíl je také znám jako absolutní průměrný rozdíl a Giniho průměrný rozdíl. Průměrný rozdíl je někdy označován jako Δ nebo jako MD. Průměrná odchylka je jiná míra rozptylu.

Pro populaci o velikosti n, s posloupností hodnot yi, i = 1 až n:

Pro funkci hustoty pravděpodobnosti f(x):

Pro kumulativní distribuční funkci F(x) s inverzní x(F):

Inverzní x(F) nemusí existovat, protože kumulativní distribuční funkce má skokové diskontinuity nebo intervaly konstantních hodnot. Předchozí vzorec však může stále platit zobecněním definice x(F):

Pokud má rozdělení pravděpodobnosti konečný a nenulový aritmetický průměr, je rozdíl relativního průměru, někdy označovaný ∇ nebo RMD, definován jako

Rozdíl relativního průměru kvantifikuje rozdíl průměru ve srovnání s velikostí průměru a je bezrozměrnou veličinou. Rozdíl relativního průměru je roven dvojnásobku Giniho koeficientu, který je definován Lorenzovou křivkou. To poskytuje doplňkové pohledy jak na rozdíl relativního průměru, tak na Giniho koeficient, včetně alternativních způsobů výpočtu jejich hodnot.

Průměrný rozdíl je invariantní k překladům a negaci a mění se úměrně k pozitivnímu škálování. To znamená, že pokud X je náhodná proměnná a c je konstanta:

Relativní průměrný rozdíl je invariantní až pozitivní škálování, komutuje s negací a při překladu se mění v poměru k poměru původního a přeloženého aritmetického průměru. To znamená, že pokud X je náhodná proměnná a c je konstanta:

Pokud má náhodná proměnná kladný průměr, pak její relativní průměrný rozdíl bude vždy větší nebo roven nule. Pokud navíc může náhodná proměnná nabývat pouze hodnot, které jsou větší nebo rovny nule, pak její relativní průměrný rozdíl bude menší než 2.

Doporučujeme:  Gilles de laTourette porucha

Ve srovnání se směrodatnou odchylkou

Směrodatná odchylka i střední odchylka měří rozptyl — jak rozptýlené jsou hodnoty populace nebo pravděpodobnosti rozdělení. Střední rozdíl není definován specifickým měřítkem střední tendence, zatímco směrodatná odchylka je definována odchylkou od aritmetického průměru. Protože směrodatná odchylka kvadratizuje své rozdíly, má tendenci dávat větší váhu větším rozdílům a menší váhu menším rozdílům ve srovnání se středním rozdílem. Když je aritmetický průměr konečný, bude střední rozdíl také konečný, i když směrodatná odchylka je nekonečná. Viz příklady pro některá specifická srovnání.

Pro náhodný vzorek S z náhodné proměnné X, skládající se z n hodnot yi, statistika

je konzistentní a nezaujatý odhad MD(X).

je konzistentní odhad RMD(X), ale není obecně nezaujatý.

Intervaly spolehlivosti pro RMD(X) lze vypočítat pomocí techniky bootstrap sampling.

Obecně neexistuje nezaujatý odhad pro RMD(X), částečně kvůli obtížnosti nalezení nezaujatého odhadu pro násobení inverzní hodnotou průměru. Například i tam, kde je známo, že vzorek je odebrán z náhodné proměnné X(p) pro neznámé p, a X(p) – 1 má Bernoulliho rozdělení, takže Pr(X(p) = 1) = 1 − p a Pr(X(p) = 2) = p, pak

Ale očekávaná hodnota případného odhadu R(S) z RMD(X(p)) bude mít formu:

kde r i jsou konstanty. Takže E(R(S)) se nikdy nemůže rovnat RMD(X(p)) pro všechna p mezi 0 a 1.