Nullova hypotéza

Nulová hypotéza (H0) je ve statistice hypotéza nastavená tak, aby byla anulována nebo vyvrácena s cílem podpořit alternativní hypotézu. Tento postup je někdy znám jako testování významnosti nulové hypotézy (NHST) nebo testování nulové hypotézy (NHT)

Při použití se předpokládá, že nulová hypotéza je pravdivá, dokud statistické důkazy ve formě testu hypotézy nenaznačí opak – to znamená, když má výzkumník určitý stupeň jistoty, obvykle 95% až 99%, že data nepodporují nulovou hypotézu. Je možné, že experiment nulovou hypotézu neodmítne. Je také možné, že jak nulová hypotéza, tak alternativní hypotéza jsou odmítnuty, pokud existuje více než tyto dvě možnosti.to není statisticky schváleno

Ve vědeckých a lékařských aplikacích hraje nulová hypotéza hlavní roli při testování významnosti rozdílů v léčebných a kontrolních skupinách. Předpokladem na počátku experimentu je, že mezi oběma skupinami neexistuje žádný rozdíl (pro srovnávanou proměnnou): to je v tomto případě nulová hypotéza. Jiné typy nulové hypotézy mohou být například takové, že:

Pojem vymyslel anglický genetik a statistik Ronald Fisher.

Například, jeden může chtít porovnat skóre testů dvou náhodných vzorků mužů a žen a zeptat se, zda jedna populace má nebo nemá průměrné skóre odlišné od druhé. Nulová hypotéza by byla, že průměrné skóre mužské populace bylo stejné jako průměrné skóre ženské populace:

Alternativně může nulová hypotéza předpokládat, že oba vzorky jsou odebrány ze stejné populace, takže rozptyl a tvar rozdělení jsou stejné, stejně jako prostředky.

Formulace nulové hypotézy je zásadním krokem při testování statistické významnosti. Po formulování takové hypotézy lze stanovit pravděpodobnost pozorování získaných dat nebo dat, která se více liší od predikce nulové hypotézy, pokud je nulová hypotéza pravdivá. Tato pravděpodobnost je to, čemu se běžně říká „hladina významnosti“ výsledků.

To znamená, že ve vědeckém experimentálním designu můžeme předpovídat, že určitý faktor bude mít vliv na naši závislou proměnnou – to je naše alternativní hypotéza. Potom zvažujeme, jak často bychom očekávali, že budeme pozorovat naše experimentální výsledky, nebo výsledky ještě extrémnější, kdybychom odebrali mnoho vzorků z populace, kde nebyl žádný účinek (tj. testujeme podle naší nulové hypotézy). Pokud zjistíme, že se to děje zřídka (řekněme do 5% času), můžeme dojít k závěru, že naše výsledky podporují naši experimentální předpověď – odmítáme naši nulovou hypotézu.

Doporučujeme:  Spotřebitelé duševního zdraví

V mnoha prohlášeních o nulových hypotézách neexistuje zdání, že tyto hypotézy mohou mít „směrovost“, v tom, že prohlášení říká, že hodnoty jsou totožné. Nulové hypotézy však mohou mít a mají „směr“ – v mnoha těchto případech statistická teorie umožňuje formulaci testovacího postupu zjednodušit tak, aby test byl rovnocenný testování na přesnou identitu. To znamená, že pokud zformulujeme jednostrannou alternativní hypotézu, že aplikace léku A povede ke zvýšenému růstu pacientů, efektivní nulová hypotéza zůstává, že aplikace léku A nebude mít žádný vliv na růst pacientů. Není to pouze opak alternativní hypotézy – to znamená, že aplikace léku A nepovede ke zvýšenému růstu pacientů. Nicméně to zůstává pravdivou nulovou hypotézou.

Pro vysvětlení, proč by tomu tak mělo být, je poučné zvážit povahu výše uvedených hypotéz. Předpovídáme, že pacienti vystavení léku A zaznamenají zvýšený růst ve srovnání s kontrolní skupinou, která lék nedostává. Tedy,

Efektivní nulová hypotéza je H0: μdrug = μcontrol

Skutečná nulová hypotéza je HT: μdrug ≤ μcontrol

Ke snížení dochází proto, že abychom mohli posoudit podporu alternativní hypotézy, vyžaduje testování klasických hypotéz, abychom spočítali, jak často bychom získali výsledky stejně nebo více extrémní než naše experimentální pozorování. Abychom to mohli udělat, musíme nejprve definovat pravděpodobnost odmítnutí nulové hypotézy pro každou možnost zahrnutou v nulové hypotéze a zadruhé zajistit, aby všechny tyto pravděpodobnosti byly menší nebo rovny citované úrovni významnosti testu. Pro každý rozumný testovací postup se největší ze všech těchto pravděpodobností vyskytne na hranici oblasti HT, konkrétně pouze pro případy zahrnuté v H0. Zkušební postup tak může být definován (tedy mohou být definovány kritické hodnoty) pro testování nulové hypotézy HT přesně tak, jako by nulovou hypotézou zájmu byla redukovaná verze H0.

Všimněme si, že existují tací, kteří tvrdí, že nulová hypotéza nemůže být tak obecná, jak je uvedeno výše: jak řekl Fisher, který jako první zavedl termín „nulová hypotéza“, „nulová hypotéza musí být přesná, tedy bez neurčitosti a nejednoznačnosti, protože musí dodávat základ pro ‚problém rozdělení‘, jehož řešením je test významnosti.“ Podle tohoto názoru tedy musí být nulová hypotéza numericky přesná – musí uvádět, že určitá veličina nebo rozdíl se rovná určitému číslu. V klasické vědě je to nejčastěji tvrzení, že neexistuje žádný účinek určitého zacházení; v pozorování je typické, že neexistuje žádný rozdíl mezi hodnotou určité měřené veličiny a hodnotou předpovědi. Užitečnost tohoto hlediska musí být zpochybňována – lze si povšimnout, že většina testů nulových hypotéz v praxi nesplňuje toto kritérium, že jsou „přesné“. Například, vezměme obvyklý test, že dva prostředky jsou stejné, kde skutečné hodnoty rozptylů jsou neznámé – přesné hodnoty rozptylů nejsou specifikovány.

Doporučujeme:  Citační dopad

Test nulové hypotézy je užitečný, protože stanovuje limit pravděpodobnosti pozorování množiny dat jako nebo více extrémní než ta, která je pozorována, pokud je nulová hypotéza pravdivá. Obecně je mnohem těžší být přesný ohledně odpovídající pravděpodobnosti, pokud je alternativní hypotéza pravdivá.

Pokud experimentální pozorování odporují předpovědi nulové hypotézy, znamená to, že buď je nulová hypotéza nepravdivá, nebo k pozorované události dochází velmi nepravděpodobně. To nám dává vysokou důvěru v nepravdivost nulové hypotézy, kterou lze zlepšit úměrně počtu provedených pokusů. Přijetí alternativní hypotézy nás však zavazuje pouze k rozdílu pozorovaných parametrů; nedokazuje, že teorie nebo principy, které předpověděly takový rozdíl, jsou pravdivé, protože je vždy možné, že tento rozdíl může být způsoben dalšími faktory, které teorie neuznává.

Například odmítnutí nulové hypotézy, která předpovídá, že míra úlevy od příznaků u vzorku pacientů, kteří dostali placebo, a vzorku, který dostal léčivý lék, bude stejná, nám umožňuje učinit nenulové prohlášení (že se míry lišily); nedokazuje, že lék ulevil od příznaků, i když nám to dává větší důvěru v tuto hypotézu.

Formulace, testování a odmítání nulových hypotéz je metodologicky v souladu s modelem falzifikovatelnosti vědeckého objevu formulovaným Karlem Popperem a všeobecně se má za to, že se vztahuje na většinu druhů empirického výzkumu. Obavy týkající se vysoké schopnosti statistických testů odhalit rozdíly u velkých vzorků však vedly k návrhům na nové definování nulové hypotézy, například jako hypotézy, že účinek spadá do rozmezí považovaného za zanedbatelný. Jedná se o pokus řešit záměnu mezi statistickými pracovníky mezi významnými a podstatnými, protože dostatečně velké vzorky jsou pravděpodobně schopny indikovat rozdíly, i když nepatrné.

Teorie, z níž vychází myšlenka nulové hypotézy, je úzce spjata s frekvenční teorií pravděpodobnosti, v níž lze pravděpodobnostní prohlášení učinit pouze o relativní frekvenci událostí v libovolně velkých vzorcích. Jedním ze způsobů, kdy je odmítnutí nulové hypotézy smysluplné, je ve vztahu k libovolně velké populaci, z níž má být odebrán sledovaný vzorek. Druhým způsobem, kdy je to smysluplné, je z přístupu, kdy se před provedením experimentu rozhoduje o experimentu i o všech detailech statistické analýzy. Úroveň významnosti testu je pak koncepčně totožná s pravděpodobností nesprávného odmítnutí nulové hypotézy posuzované ve fázi před experimentem, kdy tato pravděpodobnost nemusí být frekvenční/velká.

Doporučujeme:  Rutinní teorie aktivity

V roce 2002 spustila skupina psychologů nový časopis věnovaný experimentálním studiím v psychologii, které podporují nulovou hypotézu. Journal of Articles in Support of the Null Hypothesis (JASNH) byl založen, aby řešil zaujatost vědeckých publikací proti takovým článkům. Podle redaktorů,

„Problém se zásuvkou na soubory“ je problém, který existuje kvůli skutečnosti, že akademici mají tendenci nezveřejňovat výsledky, které naznačují, že nulovou hypotézu nebylo možné odmítnout. To neznamená, že vztah, který hledali, neexistoval, ale znamená to, že to nemohli dokázat. I když tyto práce mohou být často zajímavé, mají tendenci končit nezveřejněné, v „zásuvkách na soubory“.

Ioannidis má soupis faktorů, které by měly upozornit čtenáře na rizika publikace zkreslení.

Bayesovští statistici obvykle odmítají myšlenku testování nulové hypotézy. Vzhledem k předchozímu rozdělení pravděpodobnosti pro jeden nebo více parametrů lze použít ukázkové důkazy pro generování aktualizovaného zadního rozdělení. V tomto rámci, ale ne v rámci testování nulové hypotézy, je smysluplné dělat prohlášení obecného tvaru „pravděpodobnost, že skutečná hodnota parametru je větší než 0, je p“.

Průměr (Aritmetika, Geometrie) – Medián – Režim – Výkon – Odchylka – Směrodatná odchylka

Testování hypotéz – Význam – Nullova hypotéza/Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu

Funkce přežití – Kaplan-Meier – Logrank test – Četnost selhání – Proporcionální modely nebezpečnosti

Normal (zvonová křivka) – Poisson – Bernoulli

Matoucí veličina – Pearsonův korelační koeficient produktového momentu – Rank korelace (Spearmanův korelační koeficient hodnosti, Kendall tau korelační koeficient hodnosti)

Lineární regrese – Nelineární regrese – Logistická regrese