Ve statistice má průměr dva související významy:
U souboru dat je průměr součet pozorování dělený počtem pozorování. Průměr se často uvádí společně se směrodatnou odchylkou: průměr popisuje centrální polohu dat a směrodatná odchylka popisuje rozptyl.
Alternativní mírou rozptylu je střední odchylka, která odpovídá průměrné absolutní odchylce od průměru. Je méně citlivá na odlehlé hodnoty, ale je méně matematicky uchopitelná.
Stejně jako ve statistice se průměry často používají v geometrii a analýze; pro tyto účely byla vyvinuta široká škála průměrů, které se ve statistice příliš nepoužívají. Jsou uvedeny níže.
Aritmetický průměr je „standardní“ průměr, často nazývaný jednoduše „průměr“.
Průměr může být často zaměňován s mediánem, modem nebo rozsahem. Průměr je aritmetický průměr souboru hodnot neboli rozdělení; u šikmých rozdělení však průměr nemusí být nutně totožný se střední hodnotou (medián) nebo nejpravděpodobnější hodnotou (modus). Například průměrný příjem je zkreslen směrem nahoru malým počtem lidí s velmi vysokými příjmy, takže většina má příjem nižší než průměr. Naproti tomu medián příjmů je úroveň, při které je polovina populace pod a polovina nad. Modus příjmů je nejpravděpodobnější příjem a zvýhodňuje větší počet lidí s nižšími příjmy. Medián nebo modus jsou často intuitivnějšími měřítky těchto údajů.
Nicméně mnoho šikmých rozdělení lze nejlépe popsat pomocí jejich střední hodnoty – například exponenciální a Poissonovo rozdělení.
Geometrický průměr je průměr, který je užitečný pro množiny kladných čísel, které se interpretují podle jejich součinu, a ne podle jejich součtu (jako je tomu u aritmetického průměru), např. míry růstu.
Harmonický průměr je průměr, který je užitečný pro soubory čísel, které jsou definovány ve vztahu k nějaké jednotce, například rychlosti (vzdálenost za jednotku času).
Zobecněný průměr, známý také jako mocninný průměr nebo Hölderův průměr, je abstrakcí kvadratického, aritmetického, geometrického a harmonického průměru. Je definován pro množinu n kladných čísel xi takto
Volbou vhodné hodnoty parametru m získáme následující hodnoty
To lze dále zobecnit jako zobecněný f-průměr
a opět vhodnou volbou invertibilního prvku získáme
Váhy představují hranice dílčího vzorku. V jiných aplikacích představují míru spolehlivosti ovlivnění průměru příslušnými hodnotami.
Někdy může soubor čísel obsahovat odlehlé hodnoty, tj. údaj, který je mnohem nižší nebo mnohem vyšší než ostatní.
Odlehlé hodnoty jsou často chybné údaje způsobené artefakty. V takovém případě lze použít zkrácený průměr. Ten spočívá v tom, že se vyřadí dané části údajů na horním nebo dolním konci, obvykle stejná část na každém konci, a pak se vezme aritmetický průměr zbývajících údajů. Počet odstraněných hodnot se uvádí v procentech z celkového počtu hodnot.
Specifickým příkladem zkráceného průměru je mezikvartilový průměr. Je to jednoduše aritmetický průměr po odstranění nejnižší a nejvyšší čtvrtiny hodnot.
za předpokladu, že hodnoty byly seřazeny.
V kalkulu, a zejména ve vícerozměrném kalkulu, je střední hodnota funkce volně definována jako průměrná hodnota funkce v jejím oboru. V jedné proměnné je střední hodnota funkce f(x) na intervalu (a,b) definována takto
Tím se zobecňuje aritmetický průměr. Na druhou stranu je možné geometrický průměr zobecnit i na funkce definováním geometrického průměru f jako
Obecněji řečeno, v teorii míry a teorii pravděpodobnosti hrají oba druhy středních hodnot důležitou roli. V této souvislosti Jensenova nerovnost ostře odhaduje vztah mezi těmito dvěma různými pojetími střední hodnoty funkce.
Většina obvyklých prostředků selhává u kruhových veličin, jako jsou úhly, denní doby, zlomkové části reálných čísel.
Pro tyto veličiny potřebujete střední hodnotu kruhových veličin.
Všechny prostředky sdílejí některé vlastnosti a další vlastnosti jsou společné pro nejběžnější prostředky.
Některé z těchto vlastností jsou shromážděny zde.
Vážený průměr je funkce, která mapuje trojice kladných čísel na kladné číslo.
().
Z výše uvedených vlastností vyplývají techniky pro konstrukci složitějších prostředků:
Pokud jsou vážené prostředky,
je kladné reálné číslo,
pak s
jsou rovněž váženým průměrem.
Intuitivně řečeno, nevážený průměr je vážený průměr se stejnými váhami.
Protože naše výše uvedená definice váženého průměru nevystavuje konkrétní váhy,
musí být rovnost vah zajištěna jiným způsobem.
Jiný názor na homogenní vážení je, že vstupy lze zaměnit, aniž by se změnil výsledek.
Definujeme tedy, že se jedná o nevážený průměr, pokud se jedná o vážený průměr.
a pro každou permutaci vstupů je výsledek stejný.
Nechť je množina permutací vstupů.
Analogicky k váženým průměrům,
pokud je vážený průměr a jsou nevážené průměry,
je kladné reálné číslo,
pak s
jsou rovněž nevážené průměry.
Převod neváženého průměru na vážený průměr
Z neváženého průměru lze opakováním prvků vytvořit vážený průměr.
Toto spojení lze také použít k tvrzení, že průměr je váženou verzí neváženého průměru.
Řekněme, že máme nevážený průměr a
vážený průměr přirozenými čísly .
(Pokud jsou čísla racionální, pak je vynásobíme nejmenším společným jmenovatelem.)
Pak odpovídající vážený průměr získáme takto
Prostředky tuples různých velikostí
Pokud je průměr definován pro topy několika velikostí,
pak lze také očekávat, že průměr tuple je omezen průměry oddílů.
Přesněji řečeno
Průměrné hodnoty populace a vzorku
Střední hodnota populace má očekávanou hodnotu μ, která se nazývá střední hodnota populace. Výběrový průměr je dobrým odhadem populačního průměru, protože jeho očekávaná hodnota je stejná jako populační průměr. Výběrový průměr populace je náhodná veličina, nikoliv konstanta, a proto bude mít své vlastní rozdělení. Pro náhodný vzorek n pozorování z normálně rozdělené populace je rozdělení výběrového průměru následující
Protože je populační rozptyl neznámým parametrem, odhaduje se často pomocí součtu čtverců, čímž se rozdělení výběrového průměru změní z normálního rozdělení na Studentovo t rozdělení s n – 1 stupněm volnosti.
Tento článek je označen od února 2008.
Průměr (aritmetický, geometrický) – Medián – Modus – Výkon – Rozptyl – Směrodatná odchylka
Testování hypotéz – Významnost – Nulová hypotéza / Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu
Funkce přežití – Kaplan-Meierův test – Logrankův test – Míra selhání – Modely proporcionálních rizik
Normální (zvonová křivka) – Poissonova – Bernoulliho
Zkreslující proměnná – Pearsonův korelační koeficient součinu a momentu – Korelace pořadí (Spearmanův korelační koeficient pořadí, Kendallův korelační koeficient pořadí tau)
Lineární regrese – Nelineární regrese – Logistická regrese