Úvod do statistiky

Graf zvonové křivky s normálním rozdělením zobrazující statistické údaje používané při hodnocení ve výuce a porovnávající různé metody hodnocení. Zobrazeny jsou směrodatné odchylky, kumulativní procenta, percentilové ekvivalenty, Z-skóre, T-skóre, standardní devítky a procenta ve staninách.

Statistika je matematická věda zabývající se sběrem, analýzou, interpretací a prezentací dat. Je použitelná v široké škále akademických oborů, od fyzikálních a společenských věd až po humanitní vědy; používá se také k přijímání informovaných rozhodnutí ve všech oblastech podnikání a státní správy.

Statistické metody lze použít ke shrnutí nebo popisu souboru dat; tomu se říká popisná statistika. Dále lze modelovat vzorce v datech způsobem, který zohledňuje náhodnost a nejistotu pozorování, a vyvozovat závěry o studovaném procesu nebo populaci; tomu se říká inferenční statistika. Deskriptivní i inferenční statistiku lze považovat za součást aplikované statistiky. Existuje také obor matematická statistika, který se zabývá teoretickým základem tohoto předmětu.

Slovo statistika je také množné číslo slova statistika (jednotné číslo), které označuje výsledek použití statistického algoritmu na soubor dat, jako je statistika zaměstnanosti, statistika nehod atd.

Slovo statistika nakonec pochází z moderního latinského termínu statisticum collegium („státní rada“) a italského slova statista („státník“ nebo „politik“). Německé] Statistik, poprvé zavedené Gottfriedem Achenwallem (1749), původně označovalo analýzu údajů o státu a znamenalo „vědu o státu“ (v angličtině se pak nazývalo political arithmetic). Na počátku 19. století získala význam sběru a klasifikace dat obecně. Do angličtiny jej zavedl sir John Sinclair.

Původním hlavním účelem statistiky tedy byla data, která měla být využívána vládními a (často centralizovanými) správními orgány. Sběr údajů o státech a obcích pokračuje i nadále, a to převážně prostřednictvím národních a mezinárodních statistických služeb. Pravidelné informace o obyvatelstvu poskytují zejména sčítání lidu.

V průběhu 20. století si vytvoření přesných nástrojů pro účely veřejného zdraví (epidemiologie, biostatistika atd.) a pro ekonomické a sociální účely (míra nezaměstnanosti, ekonometrie atd.) vyžádalo značný pokrok ve statistických postupech. To se stalo nutností pro západní sociální státy vzniklé po první světové válce, které musely rozvíjet specifické znalosti o své „populaci“. Filozofové, jako například Michel Foucault, tvrdili, že se jedná o určitou formu „biologické moci“, což je termín, který od té doby používá mnoho dalších autorů.

Matematické metody statistiky vznikly na základě teorie pravděpodobnosti, jejíž počátky lze datovat do korespondence Pierra de Fermata a Blaise Pascala (1654). Nejstarší známé vědecké pojednání o tomto tématu podal Christiaan Huygens (1657). Jakob Bernoulli ve své knize Ars Conjectandi (posmrtně, 1713) a Abraham de Moivre v knize Doctrine of Chances (1718) zpracoval tento předmět jako samostatné odvětví matematiky.

Teorii omylů lze vysledovat až k dílu Opera Miscellanea Rogera Cotese (posmrtně, 1722), ale v memoárech Thomase Simpsona z roku 1755 (vytištěných 1756) byla tato teorie poprvé použita k diskusi o chybách pozorování. Reprint (1757) tohoto memoáru stanoví axiomy, že pozitivní a negativní chyby jsou stejně pravděpodobné a že existují určité přiřaditelné meze, v nichž lze předpokládat, že se všechny chyby pohybují; diskutuje se o spojitých chybách a uvádí se křivka pravděpodobnosti.

Pierre-Simon Laplace (1774) se poprvé pokusil odvodit pravidlo pro kombinaci pozorování z principů teorie pravděpodobnosti. Zákon pravděpodobnosti chyb znázornil křivkou. Odvodil vzorec pro průměr tří pozorování. Uvedl také (1781) vzorec pro zákon snadnosti chyby (termín vděčí Lagrangeovi, 1774), který však vedl k nezvládnutelným rovnicím. Daniel Bernoulli (1778) zavedl princip maximálního součinu pravděpodobností soustavy souběžných chyb.

Za metodu nejmenších čtverců, která se používala k minimalizaci chyb při měření dat, vděčíme Adrienu-Marie Legendrovi (1805), který ji zavedl ve svém díle Nouvelles méthodes pour la détermination des orbites des comètes (Nové metody určování drah komet). Z neznalosti Legendrova příspěvku irsko-americký spisovatel Robert Adrain, redaktor časopisu „The Analyst“ (1808), poprvé odvodil zákon snadnosti chyby. Uvedl dva důkazy, z nichž druhý je v podstatě stejný jako důkaz Johna Herschela (1850). Carl Friedrich Gauss podal v roce 1809 první důkaz, který byl zřejmě znám v Evropě (třetí po Adrainově důkazu). Další důkazy podali Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W. F. Donkin (1844, 1856) a Morgan Crofton (1870).

Doporučujeme:  Adaptivní systém

Dalšími autory byli Ellis (1844), Augustus De Morgan (1864), Glaisher (1872) a Giovanni Schiaparelli (1875). Petersův (1856) vzorec pro , pravděpodobnou chybu jednoho pozorování, je dobře známý.

V devatenáctém století se obecné teorii věnovali Laplace, Sylvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion a Karl Pearson. Výklad teorie zdokonalili Augustus De Morgan a George Boole.

Adolphe Quetelet (1796-1874), další významný zakladatel statistiky, zavedl pojem „průměrný člověk“ (l’homme moyen) jako prostředek k pochopení složitých společenských jevů, jako je míra kriminality, sňatečnosti nebo sebevražd.

Dnes se využití statistiky rozšířilo daleko za hranice jejího původního využití jako služby státu nebo vládě. Jednotlivci a organizace používají statistiku k pochopení dat a k přijímání informovaných rozhodnutí v přírodních a společenských vědách, medicíně, podnikání a dalších oblastech.

Statistika se obecně nepovažuje za podobor matematiky, ale za samostatný, i když příbuzný obor. Na mnoha univerzitách existují samostatné katedry matematiky a statistiky. Statistika se také vyučuje na různých katedrách, jako je psychologie, pedagogika a veřejné zdravotnictví.

Důležití přispěvatelé do statistik

Při aplikaci statistiky na vědecký, průmyslový nebo společenský problém se začíná s procesem nebo populací, kterou je třeba studovat. Může se jednat o populaci lidí v zemi, krystalových zrn v hornině nebo zboží vyrobeného v určité továrně za určité období. Může jít o proces pozorovaný v různých obdobích; údaje shromážděné o tomto druhu „populace“ tvoří tzv. časovou řadu.

Za pozornost stojí zejména koncept korelace. Statistická analýza souboru dat může odhalit, že dvě proměnné (tj. dvě vlastnosti zkoumané populace) mají tendenci se měnit společně, jako by spolu souvisely. Například studie ročního příjmu a věku úmrtí u lidí může zjistit, že chudí lidé mají tendenci žít kratší život než lidé zámožní. O těchto dvou proměnných se říká, že spolu korelují. Nelze však okamžitě vyvozovat existenci příčinného vztahu mezi oběma proměnnými; viz korelace implikuje příčinu (logický omyl).

Pokud je vzorek reprezentativní pro populaci, pak lze závěry učiněné na základě vzorku rozšířit na celou populaci. Hlavní problém spočívá v určení míry reprezentativnosti vybraného vzorku. Statistika nabízí metody pro odhad a korekci náhodnosti ve vzorku a v postupu sběru dat, stejně jako metody pro navrhování robustních experimentů v první řadě; viz experimentální design.

Základním matematickým pojmem používaným pro pochopení této náhodnosti je pravděpodobnost. Matematická statistika (nazývaná také statistická teorie) je odvětví aplikované matematiky, které využívá teorii pravděpodobnosti a analýzu ke zkoumání teoretických základů statistiky.

Použití jakékoli statistické metody je platné pouze tehdy, pokud posuzovaný systém nebo populace splňuje základní matematické předpoklady metody. Nesprávné použití statistiky může vést k jemným, ale závažným chybám v popisu a interpretaci – jemným v tom smyslu, že se jich někdy dopouštějí i zkušení odborníci, a závažným v tom smyslu, že mohou ovlivnit sociální politiku, lékařskou praxi a spolehlivost staveb, jako jsou mosty a jaderné elektrárny.

Doporučujeme:  Plovoucí vody

I při správném použití statistiky může být pro neodborníka obtížné výsledky interpretovat. Například statistická významnost trendu v datech – která měří, do jaké míry může být trend způsoben náhodnou variabilitou vzorku – nemusí souhlasit s intuitivním pocitem jeho významnosti. Soubor základních statistických dovedností (a skepse), které lidé potřebují pro práci s informacemi v každodenním životě, se označuje jako statistická gramotnost.

Experimentální a pozorovací studie

Běžným cílem statistického výzkumného projektu je zkoumat kauzalitu, zejména vyvodit závěr o vlivu změn hodnot prediktorů nebo nezávislých proměnných na odpověď nebo závislou proměnnou. Existují dva hlavní typy kauzálních statistických studií, experimentální studie a observační studie. V obou typech studií se sleduje vliv rozdílů nezávislé proměnné (nebo proměnných) na chování závislé proměnné. Rozdíl mezi oběma typy je ve způsobu, jakým je studie skutečně prováděna. Každá z nich může být velmi účinná.

Experimentální studie zahrnuje měření zkoumaného systému, manipulaci se systémem a následné provedení dalších měření stejným postupem s cílem zjistit, zda manipulace mohla změnit hodnoty měření. Naproti tomu observační studie nezahrnuje experimentální manipulaci. Místo toho se shromažďují údaje a zkoumají se korelace mezi prediktory a odezvou.

Příkladem experimentální studie jsou slavné Hawthornské studie, které se pokoušely otestovat změny pracovního prostředí v závodě Hawthorne společnosti Western Electric Company. Výzkumníky zajímalo, zda zvýšené osvětlení zvýší produktivitu pracovníků montážní linky. Výzkumníci nejprve měřili produktivitu v závodě a poté upravili osvětlení v určité části závodu, aby zjistili, zda změny osvětlení ovlivní produktivitu. Kvůli chybám v experimentálních postupech, konkrétně kvůli absenci kontrolní skupiny a zaslepení, nemohli výzkumníci provést to, co plánovali, což je známé jako Hawthornský efekt.

Příkladem observační studie je studie, která zkoumá souvislost mezi kouřením a rakovinou plic. Tento typ studie obvykle využívá průzkum ke shromáždění pozorování o oblasti zájmu a následně provádí statistickou analýzu. V tomto případě by výzkumníci shromáždili pozorování kuřáků i nekuřáků a poté by se zabývali počtem případů rakoviny plic v každé skupině.

Základní kroky experimentu jsou následující:

Ve statistice se používají čtyři typy měření nebo stupnic měření. Tyto čtyři typy nebo úrovně měření (nominální, ordinální, intervalové a poměrové) mají ve statistickém výzkumu různou míru užitečnosti. Poměrová měření, kde je definována jak nulová hodnota, tak vzdálenosti mezi jednotlivými měřeními, poskytují největší flexibilitu statistických metod, které lze použít pro analýzu dat. Intervalová měření mají smysluplné vzdálenosti mezi měřeními, ale nemají smysluplnou nulovou hodnotu (například měření IQ nebo měření teploty ve stupních Celsia). Ordinální měření mají nepřesné rozdíly mezi po sobě jdoucími hodnotami, ale smysluplné pořadí těchto hodnot. Nominální měření nemají smysluplné pořadí mezi hodnotami.

Některé známé statistické testy a postupy pro výzkumná pozorování jsou:

Některé vědy používají aplikovanou statistiku v takové míře, že mají specializovanou terminologii. Mezi tyto obory patří:

Rychlý a trvalý nárůst výpočetního výkonu počínaje druhou polovinou 20. století měl zásadní vliv na praxi statistické vědy. První statistické modely byly téměř vždy ze třídy lineárních modelů, ale výkonné počítače spolu s vhodnými numerickými algoritmy způsobily oživení zájmu o nelineární modely (zejména neuronové sítě a rozhodovací stromy) a vytvoření nových typů, jako jsou zobecněné lineární modely a víceúrovňové modely.

Počítačová revoluce má vliv na budoucnost statistiky, která se nově zaměřuje na „experimentální“ a „empirickou“ statistiku a na velké množství statistických balíčků.

Obecně panuje názor, že statistické znalosti jsou až příliš často záměrně zneužívány tím, že se hledají způsoby interpretace dat, které jsou výhodné pro předkladatele. (Známý citát, který je různě připisován, ale předpokládá se, že pochází od Benjamina Disraeliho, zní: „Existují tři druhy lží – lži, zatracené lži a statistika.“) Známá kniha Jak lhát se statistikou od Darrella Huffa skutečně pojednává o mnoha případech klamavého použití statistiky se zaměřením na zavádějící grafy. Výběrem (nebo odmítnutím či úpravou) určitého vzorku lze manipulovat s výsledky; vyřazení odlehlých hodnot je jedním z prostředků, jak toho dosáhnout. Může jít o důsledek přímého podvodu nebo o nenápadné a neúmyslné zkreslení ze strany výzkumníka.

Doporučujeme:  Rovné a křivé myšlení

Vzhledem k tomu, že další studie jsou v rozporu s dříve oznámenými výsledky, mohou se lidé začít obávat těmto studiím věřit. Člověk si může přečíst studii, která říká (například) „provádějte X, abyste snížili vysoký krevní tlak“, následovanou studií, která říká „provádění X nemá vliv na vysoký krevní tlak“, následovanou studií, která říká „provádění X ve skutečnosti vysoký krevní tlak zhoršuje“. Často byly studie prováděny na různých skupinách s různými protokoly nebo studie na malém vzorku, která slibovala zajímavé výsledky, neobstála při dalším zkoumání ve studii na velkém vzorku. Mnoho čtenářů si však těchto rozdílů nemuselo všimnout, nebo média tyto zásadní kontextové informace příliš zjednodušila, a tím se zvýšila nedůvěra veřejnosti ke statistikám.

Hlubší kritika však vychází ze skutečnosti, že přístup testování hypotéz, který je široce používán a v mnoha případech vyžadován zákonem nebo nařízením, nutí k „upřednostnění“ jedné hypotézy (nulová hypotéza) a může se také zdát, že přehání význam malých rozdílů v rozsáhlých studiích. Rozdíl, který je vysoce statisticky významný, může být přesto bez praktického významu.

V oblasti psychologie a medicíny, zejména v souvislosti se schvalováním nových léků Úřadem pro kontrolu potravin a léčiv, se v posledních letech zvýšila kritika přístupu založeného na testování hypotéz. Jednou z reakcí byl větší důraz na p-hodnotu namísto prostého uvádění, zda byla hypotéza na dané hladině významnosti zamítnuta, či nikoliv . I v tomto případě se však jedná o shrnutí důkazů o účinku, nikoliv však o velikost účinku. Jedním ze stále častějších přístupů je uvádět místo toho intervaly spolehlivosti, protože ty ukazují jak velikost účinku, tak nejistotu, která jej obklopuje. To pomáhá při interpretaci výsledků, protože interval spolehlivosti pro danou hodnotu současně udává statistickou významnost i velikost účinku.

Všimněte si, že jak p-hodnota, tak interval spolehlivosti vycházejí ze stejných základních výpočtů, jaké se používají při testu hypotéz. Výsledky jsou uvedeny v podrobnějším formátu, nikoliv v konečné podobě „ano“ nebo „ne“ testu hypotézy, ale používají stejnou základní statistickou metodiku.

Skutečně odlišným přístupem je použití bayesovských metod; viz bayesovská inference. I tento přístup byl však kritizován. Silná touha po schválení dobrých léků a omezení těch škodlivých nebo neužitečných zůstává konfliktním napětím (v jazyce testování hypotéz chyby typu I a typu II).

Robert P. Abelson ve své knize Statistics As Principled Argument uvádí, že statistika slouží jako standardizovaný prostředek k urovnávání sporů mezi vědci, kteří by jinak mohli donekonečna argumentovat o opodstatněnosti svých vlastních případů. Statistika je podle něj formou rétoriky. To lze považovat za pozitivum nebo negativum, ale stejně jako u jiných prostředků řešení sporů mohou být statistické metody úspěšné pouze tehdy, pokud obě strany akceptují tento přístup a dohodnou se na konkrétní metodě, která bude použita.

Obecné stránky a organizace

Online kurzy a učebnice