Směrodatná odchylka

Graf normálního rozdělení (nebo zvonové křivky). Každý barevný pruh má šířku jedné směrodatné odchylky.

Soubor dat s průměrem 50 (zobrazeno modře) a směrodatnou odchylkou (σ) 20.

V teorii pravděpodobnosti a statistice je směrodatná odchylka statistického souboru, datového souboru nebo rozdělení pravděpodobnosti druhou odmocninou jeho rozptylu. Směrodatná odchylka je široce používané měřítko variability nebo rozptylu, které je algebraicky více tažné, i když prakticky méně robustní než očekávaná odchylka nebo průměrná absolutní odchylka.

Ukazuje, jak velká je odchylka od „průměru“ (průměr). Nízká směrodatná odchylka znamená, že datové body mají tendenci být velmi blízko průměru, zatímco vysoká směrodatná odchylka znamená, že údaje jsou rozloženy do velkého rozsahu hodnot.

Termín směrodatná odchylka byl poprvé písemně použit Karlem Pearsonem v roce 1894, po jeho použití v přednáškách. To bylo jako náhrada dřívějších alternativních názvů pro stejnou myšlenku: například Gauss použil „střední chybu“. Užitečnou vlastností směrodatné odchylky je, že na rozdíl od rozptylu je vyjádřena ve stejných jednotkách jako data. Všimněte si však, že pro měření s procentem jako jednotkou bude mít směrodatná odchylka procento jako jednotku.

Je-li k dispozici pouze vzorek údajů z populace, lze směrodatnou odchylku populace odhadnout pomocí modifikované veličiny zvané směrodatná odchylka vzorku, vysvětlené níže.

Celkem je osm datových bodů s průměrnou (nebo průměrnou) hodnotou 5:

Pro výpočet směrodatné odchylky základního souboru se nejprve vypočte rozdíl každého datového bodu od průměru a výsledek se umocní na druhou:

Další vydělit součet těchto hodnot počtem hodnot a vzít druhou odmocninu dát směrodatnou odchylku:

Proto výše uvedené má populační směrodatnou odchylku 2.

Výše uvedené předpokládá kompletní populaci. Pokud se 8 hodnot získá náhodným výběrem z nějaké rodičovské populace, pak by se při výpočtu směrodatné odchylky vzorku použil jmenovatel 7 místo 8. Vysvětlení viz níže uvedený oddíl Odhad.

Rozdělení pravděpodobnosti nebo náhodná veličina

Nechť X je náhodná proměnná se střední hodnotou μ:

Zde operátor E označuje průměrnou nebo očekávanou hodnotu X. Pak směrodatná odchylka X je množství

To znamená, že směrodatná odchylka σ (sigma) je odmocnina průměrné hodnoty (X − μ)2.

V případě, kdy X bere náhodné hodnoty z konečné datové sady , s každou hodnotu mají stejnou pravděpodobnost, směrodatná odchylka je

nebo pomocí souhrnného zápisu,

Směrodatná odchylka (jednorozměrného) rozdělení pravděpodobnosti je stejná jako u náhodné proměnné s tímto rozdělením. Ne všechny náhodné proměnné mají směrodatnou odchylku, protože tyto očekávané hodnoty nemusejí existovat. Například směrodatná odchylka náhodné proměnné, která následuje po Cauchyho rozdělení, není definována, protože její očekávaná hodnota není definována.

Kontinuální náhodná proměnná

Směrodatná odchylka spojité náhodné veličiny X v reálné hodnotě s funkcí hustoty pravděpodobnosti p(x) je

a kde integrály jsou definitivní integrály přijata pro x rozmezí přes vzorek prostoru X.

V případě skupiny distribucí parametrů lze směrodatnou odchylku vyjádřit pomocí parametrů. Například v případě logaritmicko-normálního rozdělení s parametry μ a σ2 je směrodatná odchylka [(exp(σ2)-1)exp(2μ+σ2)]1/2.

Lze zjistit směrodatnou odchylku celé populace v případech (jako je standardizované testování), kdy se odebírá vzorek z každého člena populace. V případech, kdy to není možné, se směrodatná odchylka σ odhadne zkoumáním náhodného vzorku odebraného z populace. Některé odhady jsou uvedeny níže:

Se směrodatnou odchylkou vzorku

Odhad pro σ, který se někdy používá, je směrodatná odchylka vzorku, označená sn a definovaná takto:

Tento odhad má rovnoměrně menší střední kvadratickou chybu než „směrodatná odchylka vzorku“ (viz níže) a je maximálním odhadem pravděpodobnosti, kdy je populace normálně rozložena. Tento odhad však při použití na malý nebo středně velký vzorek bývá příliš nízký: je to zkreslený odhad.

Směrodatná odchylka vzorku je shodná s populační směrodatnou odchylkou diskrétní náhodné veličiny, která může předpokládat přesně hodnoty z datového souboru, přičemž pravděpodobnost každé hodnoty je úměrná její multiplicitě v datovém souboru.

Se směrodatnou odchylkou vzorku

Nejběžnějším odhadem pro σ je upravená verze, tedy směrodatná odchylka vzorku, označená „s“ a definovaná takto:

kde je vzorek a je průměrem vzorku. Tato korekce (použití N − 1 místo N) je známá jako Besselova korekce. Důvodem této korekce je, že s2 je nezkresleným odhadem rozptylu σ2 základního souboru, pokud tento rozptyl existuje a hodnoty vzorku jsou vykresleny nezávisle s náhradou. Nicméně s není nezkresleným odhadem směrodatné odchylky σ; má tendenci podceňovat směrodatnou odchylku základního souboru.

Všimněte si, že termín „směrodatná odchylka vzorku“ se používá pro nekorigovaný odhad (za použití N), zatímco termín „směrodatná odchylka vzorku“ se používá pro korigovaný odhad (za použití N − 1). Jmenovatel N − 1 je počet stupňů volnosti ve vektoru reziduí,
.

I když je při normálním rozdělení náhodné veličiny znám nezaujatý odhad σ, vzorec je komplikovaný a představuje menší korekci: více podrobností viz Nezaujatý odhad směrodatné odchylky. Navíc nezaujatost (v tomto smyslu slova) není vždy žádoucí: viz zaujatost odhadu.

Identity a matematické vlastnosti

Směrodatná odchylka je invariantní vůči změnám umístění a škáluje se přímo se stupnicí náhodné proměnné. Tedy pro konstantní c a náhodné proměnné X a Y:

Doporučujeme:  Dualismus

Směrodatná odchylka součtu dvou náhodných veličin může být vztažena k jejich jednotlivým směrodatným odchylkám a kovarianci mezi nimi:

kde a stát pro rozptyl a kovariance, resp.

Výpočet součtu čtvercových odchylek lze vztáhnout k momentům vypočítaným přímo z dat. Obecně máme

Pro konečné populace se stejnou pravděpodobností ve všech bodech, máme

Směrodatná odchylka se tedy rovná druhé odmocnině z (průměr čtverců minus druhá mocnina průměru).
Důkaz této skutečnosti naleznete ve výpočetním vzorci pro rozptyl a pro analogický výsledek pro směrodatnou odchylku vzorku.

Výklad a použití

Velká směrodatná odchylka znamená, že datové body jsou daleko od průměru a malá směrodatná odchylka znamená, že jsou seskupeny těsně kolem průměru.

Například každá ze tří populací {0, 0, 14, 14}, {0, 6, 8, 14} a {6, 6, 8, 8} má průměr 7. Jejich směrodatné odchylky jsou 7, 5 a 1. Třetí populace má mnohem menší směrodatnou odchylku než ostatní dvě, protože její hodnoty se všechny blíží 7. Ve volném slova smyslu nám směrodatná odchylka říká, jak daleko od průměru mají datové body tendenci být. Bude mít stejné jednotky jako samotné datové body. Pokud například datová sada {0, 6, 8, 14} představuje věk populace čtyř sourozenců v letech, směrodatná odchylka je 5 let.

Další příklad: populace {1000, 1006, 1008, 1014} může reprezentovat vzdálenosti ujeté čtyřmi sportovci, měřeno v metrech. Má průměr 1007 metrů a směrodatnou odchylku 5 metrů.

Směrodatná odchylka může sloužit jako míra nejistoty. Ve fyzikálních vědách by například uváděná směrodatná odchylka skupiny opakovaných měření měla udávat přesnost těchto měření. Při rozhodování, zda měření souhlasí s teoretickou predikcí, má směrodatná odchylka těchto měření zásadní význam: pokud je průměr měření příliš daleko od predikce (se vzdáleností měřenou ve směrodatných odchylkách), pak je pravděpodobně nutné testovanou teorii revidovat. To dává smysl, protože se vymykají rozsahu hodnot, které by bylo možné rozumně očekávat, že nastanou, pokud by predikce byla správná a směrodatná odchylka by byla vhodně kvantifikována. Viz interval predikce.

Praktická hodnota pochopení směrodatné odchylky množiny hodnot spočívá v ocenění toho, jak velká je odchylka od „průměru“ (průměr).

Jako jednoduchý příklad si vezměme průměrné teploty ve městech. Zatímco ve dvou městech může být průměrná teplota 15 °C, je užitečné pochopit, že rozpětí pro města blízko pobřeží je menší než pro města ve vnitrozemí, což objasňuje, že zatímco průměr je podobný, šance na rozdíly je větší ve vnitrozemí než u pobřeží.

Takže průměr 15 se vyskytuje pro jedno město s maximy 25 °C a minimy 5 °C a také pro jiné město s maximy 18 a minimy 12. Směrodatná odchylka nám umožňuje rozpoznat, že průměr pro město s širší odchylkou, a tedy vyšší směrodatnou odchylkou, nenabídne tak spolehlivou předpověď teploty jako město s menší odchylkou a nižší směrodatnou odchylkou.

Dalším způsobem, jak to vidět, je zvážit sportovní týmy. V jakékoli sadě kategorií, tam bude týmy, které ohodnotí vysoce na některé věci a špatně na jiné. Šance jsou, že týmy, které vedou v pořadí nebude vykazovat takový nepoměr, ale bude podávat dobré výkony ve většině kategorií. Čím nižší směrodatná odchylka jejich hodnocení v každé kategorii, tím vyváženější a konzistentnější budou mít tendenci být. Zatímco týmy s vyšší směrodatnou odchylkou bude více nepředvídatelné. Například tým, který je trvale špatný ve většině kategorií bude mít nízkou směrodatnou odchylku. Tým, který je trvale dobrý ve většině kategorií bude mít také nízkou směrodatnou odchylku. Nicméně, tým s vysokou směrodatnou odchylkou může být typ týmu, který skóruje hodně (silný útok), ale také připouští hodně (slabá obrana), nebo, naopak, který může mít špatný útok, ale kompenzuje tím, že je obtížné skóre na.

Snaha předpovědět, které týmy v daný den vyhrají, může zahrnovat pohled na směrodatné odchylky různých hodnocení týmových „statistik“, ve kterých mohou anomálie odpovídat silné vs. slabé stránky, aby se pokusila pochopit, jaké faktory mohou převážit jako silnější indikátory případných výsledků skórování.

V závodech se jezdci měří časy na po sobě jdoucích kolech. Jezdec s nízkou směrodatnou odchylkou časů na kolo je konzistentnější než jezdec s vyšší směrodatnou odchylkou. Tyto informace mohou pomoci pochopit, kde lze najít příležitosti ke zkrácení časů na kolo.

Například předpokládejme, že investor si musel vybrat mezi dvěma akciemi. Akcie A za posledních 20 let měla průměrný výnos 10%, se směrodatnou odchylkou 20 procentních bodů (p.b.) a akcie B za stejné období měla průměrné výnosy 12%, ale vyšší směrodatnou odchylku 30 p.b. Na základě rizika a výnosu může investor rozhodnout, že akcie A je bezpečnější volbou, protože další 2% výnos akcie B nestojí za dalších 10 p.b. směrodatnou odchylku (větší riziko nebo nejistota očekávaného výnosu). Akcie B pravděpodobně zaostává za počáteční investicí (ale také překročí počáteční investici) častěji než akcie A za stejných okolností a odhaduje se, že se vrátí v průměru jen o 2%. V tomto příkladu se očekává, že akcie A vydělá asi 10%, plus minus 20 p.b. (rozmezí 30% až -10%), asi dvě třetiny výnosů v budoucím roce. Při zvažování extrémnějších možných výnosů nebo výsledků v budoucnosti by investor měl očekávat výsledky až 10% plus minus 60 p.b., nebo rozmezí od 70% do (−)50%, což zahrnuje výsledky pro tři standardní odchylky od průměrného výnosu (asi 99,7% pravděpodobných výnosů).

Doporučujeme:  Rasové a etnické skupiny

Výpočet průměrného výnosu (nebo aritmetického průměru) cenného papíru za daný počet období vygeneruje očekávaný výnos z daného aktiva. Pro každé období odečtením očekávaného výnosu od skutečného výnosu vznikne rozptyl. Srovnáním rozptylu v každém období zjistíme vliv výsledku na celkové riziko aktiva. Čím větší je rozptyl v období, tím větší riziko cenný papír nese. Vezmeme-li průměr čtvercových rozptylů, vyčíslíme celkové jednotky rizika spojeného s daným aktivem. Nalezení druhé odmocniny tohoto rozptylu vyústí ve směrodatnou odchylku daného investičního nástroje.

Směrodatná odchylka populace se používá k nastavení šířky Bollingerových pásem, což je široce přijatý nástroj technické analýzy. Například horní Bollingerovo pásmo se udává jako:

Abychom získali nějaké geometrické poznatky, začneme s populací tří hodnot, x1, x2, x3. To definuje bod P = (x1, x2, x3) v R3. Vezměme si přímku L = {(r, r, r) : r v R}. To je „hlavní úhlopříčka“ procházející počátkem. Pokud by naše tři dané hodnoty byly všechny stejné, pak by směrodatná odchylka byla nula a P by leželo na L. Není tedy nerozumné předpokládat, že směrodatná odchylka souvisí se vzdáleností P k L. A to je skutečně ten případ. Pro kolmý pohyb z L do bodu P, jeden začíná v bodě:

jejichž souřadnice jsou průměrem hodnot, se kterými jsme začínali. Malá algebra ukazuje, že vzdálenost mezi P a M (která je stejná jako ortogonální vzdálenost mezi P a přímkou L) se rovná směrodatné odchylce vektoru x1, x2, x3, vydělené odmocninou z počtu rozměrů vektoru.

Pozorování je jen zřídka vzdáleno od průměru více než několik směrodatných odchylek.
Čebyševova nerovnost zahrnuje následující hranice pro všechna rozdělení, pro která je směrodatná odchylka definována.

Pravidla pro běžně distribuované údaje

Tmavě modrá je menší než jedna směrodatná odchylka od průměru. Pro normální rozdělení to představuje 68,27 % množiny; zatímco dvě směrodatné odchylky od průměru (střední a tmavě modrá) představují 95,45 %, tři směrodatné odchylky (světlá, střední a tmavě modrá) představují 99,73 % a čtyři směrodatné odchylky představují 99,994 %. Dva body křivky, které jsou jednou směrodatnou odchylkou od průměru, jsou také inflexními body.

Centrální limitní věta říká, že rozdělení součtu mnoha nezávislých, identicky distribuovaných náhodných proměnných směřuje ke slavnému „zvonovitému“ normálnímu rozdělení s funkcí hustoty pravděpodobnosti:

kde je aritmetický průměr vzorku. Směrodatná odchylka je tedy jednoduše škálovací veličina, která upravuje, jak široká bude křivka, i když se také objevuje v normalizační konstantě, aby se rozdělení normalizovalo pro různé šířky.

Je-li distribuce dat přibližně normální, pak je podíl hodnot dat v rámci z směrodatných odchylek od průměru definován pomocí erf (zσ / √2). Procento hodnot dat v rámci z směrodatných odchylek od průměru je definováno pomocí erf(zσ / √2) × 50% + 50%. Je-li distribuce dat přibližně normální, pak je přibližně 68% hodnot dat v rámci 1 směrodatné odchylky od průměru (matematicky μ ± σ, kde μ je aritmetický průměr), přibližně 95% je v rámci dvou směrodatných odchylek (μ ± 2σ) a přibližně 99,7% leží v rámci 3 směrodatných odchylek (μ ± 3σ). To je známé jako pravidlo 68-95-99,7, neboli empirické pravidlo.

Pro různé hodnoty z je předpokládané procento hodnot ležících v symetrickém intervalu spolehlivosti CI = (−zσ, zσ) následující:

Vztah mezi směrodatnou odchylkou a průměrem

Průměr a směrodatná odchylka souboru dat se obvykle vykazují společně. V určitém smyslu je směrodatná odchylka „přirozeným“ měřítkem statistického rozptylu, pokud se střed dat měří okolo průměru. Je to proto, že směrodatná odchylka od průměru je menší než od jakéhokoli jiného bodu. Přesné vyjádření je následující: předpokládejme, že x1, …, xn jsou reálná čísla a definují funkci:

Pomocí kalkulu nebo vyplněním čtverce je možné ukázat, že σ(r) má unikátní minimum v průměru:

Variační koeficient vzorku je poměr směrodatné odchylky k průměru. Jedná se o bezrozměrné číslo, které lze použít pro porovnání velikosti variance mezi populacemi s průměry, které jsou blízko sebe. Důvodem je, že pokud porovnáte populace se stejnými směrodatnými odchylkami, ale s odlišnými průměry, pak bude variační koeficient větší pro populaci s menším průměrem. Při porovnávání variability údajů by tedy měl být variační koeficient používán opatrně a měl by být lépe nahrazen jinou metodou.

Často chceme nějakou informaci o přesnosti získaného průměru. Tu můžeme získat určením směrodatné devakce výběrového průměru.
Směrodatná odchylka průměru souvisí se směrodatnou odchylkou rozdělení podle:

Doporučujeme:  Sexuální kapitál

kde N je počet pozorování ve vzorku použitý k odhadu průměru. To lze snadno prokázat pomocí:

Směrodatná odchylka diskrétní náhodné veličiny je odchylka jejích hodnot od průměru (root-mean-square, RMS).

Pokud náhodná proměnná X nabývá se stejnou pravděpodobností hodnoty N (což jsou reálná čísla), pak lze její směrodatnou odchylku σ vypočítat takto:

Tento výpočet je popsán následujícím vzorcem:

kde je aritmetický průměr hodnot xi, definovaný jako:

Pokud ne všechny hodnoty mají stejnou pravděpodobnost, ale pravděpodobnost hodnoty xi se rovná pí, lze směrodatnou odchylku vypočítat takto:

Předpokládejme, že jsme si přáli najít směrodatnou odchylku rozdělení umístění pravděpodobnosti 1/4, 1/2, a 1/4 na body v prostoru vzorku 3, 7, a 19.

Krok 1: nalezení pravděpodobnostně váženého průměru

Krok 2: najít odchylku každé hodnoty v prostoru vzorku od průměru,

3. krok: umocnit každou z odchylek, která umocňuje velké odchylky a dělá záporné hodnoty kladné,

Krok 4: najít pravděpodobnostně vážený průměr čtvercových odchylek,

Krok 5: vezměte kladnou odmocninu kvocientu (převádění čtvercových jednotek zpět na běžné jednotky),

Směrodatná odchylka množiny je tedy 6. Tento příklad také ukazuje, že obecně se směrodatná odchylka liší od střední absolutní odchylky (která je v tomto příkladu 5).

Následující dva vzorce mohou představovat průběžnou (spojitou) směrodatnou odchylku. Sada tří mocninných součtů s0,1,2 se vypočítává přes sadu N hodnot x, označených jako xk.

Všimněte si, že s0 zvyšuje x na nulový výkon, a protože x0 je vždy 1, s0 se vyhodnocuje na N.

Vzhledem k výsledkům těchto tří běžících součtů lze hodnoty s0,1,2 kdykoli použít k výpočtu aktuální hodnoty běžící směrodatné odchylky. Tato definice pro sj může reprezentovat dvě různé fáze (součtový výpočet sj a výpočet).

Podobně pro směrodatnou odchylku vzorku,

V počítačové implementaci, kdy se tři součty sj stávají velkými, je třeba vzít v úvahu zaokrouhlovací chybu, aritmetické přetečení a aritmetické podtečení. Níže uvedená metoda počítá metodu průběžných součtů s redukovanými chybami zaokrouhlování:

kde A je střední hodnota.

Pokud jsou hodnoty xi váženy nerovnými váhami wi, vypočítají se součty mocnin s0,1,2 takto:

A rovnice směrodatné odchylky se nemění. Všimněte si, že s0 je nyní součet hmotností a ne počet vzorků N.

Lze použít i inkrementální metodu s menším počtem chyb při zaokrouhlování, což je o něco složitější.

Běžný součet vah musí být vypočten:

a místa, kde je výše použita 1/i, musí být nahrazena wi/Wi:

kde n je celkový počet prvků a n‘ je počet prvků s nenulovou hmotností.
Výše uvedené vzorce se rovnají výše uvedeným jednodušším vzorcům, pokud se hmotnosti rovnají 1.

Kombinované směrodatné odchylky

Statistiky založené na počtu obyvatel

Směrodatné odchylky nepřekrývajících se dílčích populací lze agregovat takto, pokud je známa velikost (skutečná nebo vzájemná) a prostředky každé z nich:

Předpokládejme například, že je známo, že průměrný Američan má průměrnou výšku 70 palců se směrodatnou odchylkou 3 palce a že průměrná Američanka má průměrnou výšku 65 palců se směrodatnou odchylkou 2 palce. Průměrná a směrodatná odchylka pro dospělé Američany by se dala vypočítat takto:

Pro obecnější M nepřekrývající se datové soubory X1 až XM:

Je-li velikost (skutečná nebo vzájemná), průměr a směrodatná odchylka dvou překrývajících se populací známa pro populace i jejich průnik, pak směrodatná odchylka celkové populace může být ještě vypočtena takto:

Pokud se přidávají dva nebo více souborů dat párovým způsobem, lze směrodatnou odchylku vypočítat, pokud je známa kovariance mezi každým párem souborů dat.

Pro speciální případ, kdy neexistuje korelace mezi všemi dvojicemi datových souborů, pak se vztah redukuje na:

Směrodatné odchylky dílčích vzorků, které se nepřekrývají, lze agregovat takto, jsou-li známy skutečná velikost a prostředky každého z nich:

Pro obecnější M nepřekrývající se datové soubory X1 až XM:

Jsou-li u vzorků známy velikost, průměr a směrodatná odchylka dvou překrývajících se vzorků i jejich průnik, pak lze směrodatnou odchylku vzorků ještě vypočítat. Obecně:

Průměr (Aritmetika, Geometrie) – Medián – Režim – Výkon – Odchylka – Směrodatná odchylka

Testování hypotéz – Význam – Nullova hypotéza/Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu

Funkce přežití – Kaplan-Meier – Logrank test – Četnost selhání – Proporcionální modely nebezpečnosti

Normal (zvonová křivka) – Poisson – Bernoulli

Matoucí veličina – Pearsonův korelační koeficient produktového momentu – Rank korelace (Spearmanův korelační koeficient hodnosti, Kendall tau korelační koeficient hodnosti)

Lineární regrese – Nelineární regrese – Logistická regrese