Absolutní odchylka

Absolutní odchylka prvku datové sady je absolutní rozdíl mezi tímto prvkem a daným bodem. Obvykle je bodem, od kterého se odchylka měří, hodnota buď mediánu, nebo průměru datové sady.

Průměrná absolutní odchylka datového souboru je průměr (nebo očekávaná hodnota) absolutních odchylek a je souhrnnou statistikou statistického rozptylu nebo variability.

Průměrná absolutní odchylka množiny {x0, x1, …, xn−1} je:

je zvolená hodnota střední tendence množiny, o které se měří průměrná absolutní odchylka.

Medián je bod, který minimalizuje průměrnou absolutní odchylku množiny dat. Například pro množinu {1,2,2,4,6}, je medián 2, zatímco průměr je 3. Průměrná absolutní odchylka od mediánu je (1+0+0+2+4)/5=1,4, zatímco průměrná absolutní odchylka od průměru (někdy nazývaná průměrná odchylka) je (2+1+1+1+3)/5=1,6.

Obecně platí, že průměrná absolutní odchylka od průměru je mezi jedním a dvojnásobkem průměrné absolutní odchylky od mediánu; je také menší nebo rovna směrodatné odchylce.

Několik měřítek statistického rozptylu je definováno z hlediska absolutní odchylky.

Průměrná absolutní odchylka

Průměrná absolutní odchylka nebo jednoduše průměrná odchylka množiny dat je průměrem absolutních odchylek a je souhrnnou statistikou statistické rozptylu nebo variability. Říká se jí také průměrná absolutní odchylka, ale tu lze snadno zaměnit se střední absolutní odchylkou.

Průměrná absolutní odchylka množiny {x1, x2, …, xn} je

Volba míry centrální tendence,

, má výrazný vliv na hodnotu průměrné odchylky. Například pro sadu dat {2, 2, 3, 4, 14}:

Průměrná absolutní odchylka od mediánu je menší nebo rovna průměrné absolutní odchylce od průměru. Průměrná absolutní odchylka od mediánu je totiž vždy menší nebo rovna průměrné absolutní odchylce od jakéhokoli jiného pevného čísla.

Průměrná absolutní odchylka od průměru je menší nebo rovna směrodatné odchylce; jeden ze způsobů, jak to dokázat, se opírá o Jensenovu nerovnost.

Doporučujeme:  ADME

Pro normální nebo „Gaussovo“ rozdělení je poměr střední absolutní odchylky ke směrodatné odchylce

. Pokud je tedy X normálně rozložená náhodná proměnná s očekávanou hodnotou 0 pak

Jinými slovy, pro Gaussiana je průměrná absolutní odchylka asi 0,8násobek směrodatné odchylky.

Průměrná absolutní odchylka (MAD), označovaná také jako průměrná odchylka, je průměr absolutních odchylek souboru údajů o průměru údajů. Jinými slovy, je to průměrná vzdálenost souboru údajů od jeho průměru za určitý počet časových období.

Rovnice pro MAD je následující:

Tato metoda přesnosti předpovědi velmi úzce souvisí s metodou střední kvadratické chyby (MSE), která je jen průměrnou kvadratickou chybou předpovědí. I když jsou tyto metody velmi úzce příbuzné MAD se používá častěji, protože nevyžaduje kvadraturu.

Rovnice pro MSE je následující:

MSE = 1/n Σ(ei2) , kde ei = Fi – Di

Medián absolutní odchylky (MAD)

Medián absolutní odchylky je medián absolutní odchylky od mediánu. Je to robustní odhad rozptylu.

Pro příklad {2, 2, 3, 4, 14}: 3 je medián, takže absolutní odchylky od mediánu jsou {1, 1, 0, 1, 11} (přeřazené jako {0, 1, 1, 1, 11}) s mediánem 1, v tomto případě neovlivněným hodnotou odlehlé 14, takže medián absolutní odchylky (také nazývaný MAD) je 1.

Maximální absolutní odchylka

Maximální absolutní odchylka o bod je maximum absolutních odchylek vzorku od tohoto bodu. Je realizována maximem vzorku nebo minimem vzorku a nemůže být menší než polovina rozsahu.

Měřítka statistického rozptylu odvozená z absolutní odchylky charakterizují různá měřítka centrální tendence jako minimalizující rozptyl:
Medián je měřítkem centrální tendence nejvíce spojené s absolutní odchylkou, v tom, že

Průměr (Aritmetika, Geometrie) – Medián – Režim – Výkon – Odchylka – Směrodatná odchylka

Testování hypotéz – Význam – Nullova hypotéza/Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu

Doporučujeme:  Richard Ofshe

Funkce přežití – Kaplan-Meier – Logrank test – Četnost selhání – Proporcionální modely nebezpečnosti

Normal (zvonová křivka) – Poisson – Bernoulli

Matoucí veličina – Pearsonův korelační koeficient produktového momentu – Rank korelace (Spearmanův korelační koeficient hodnosti, Kendall tau korelační koeficient hodnosti)

Lineární regrese – Nelineární regrese – Logistická regrese