t test je jakýkoliv test statistické hypotézy, ve kterém má statistika testu Studentovo t rozdělení, pokud je nulová hypotéza pravdivá.
Statistiku t zavedl William Sealy Gosset pro levné sledování kvality piv. „Student“ bylo jeho pseudonymem. Gosset byl statistikem pivovaru Guinness v irském Dublinu a byl najat kvůli inovativní politice Clauda Guinnesse, který najímal nejlepší absolventy Oxfordu a Cambridge, aby aplikovali biochemii a statistiku na Guinnessovy průmyslové procesy. Gosset publikoval t test v Biometrice v roce 1908, ale byl donucen používat pseudonym svým zaměstnavatelem, který považoval skutečnost, že používali statistiku za obchodní tajemství. Ve skutečnosti nebyla Gossetova identita známa jen kolegům statistikům, ale i jeho zaměstnavateli – společnost trvala na pseudonymu, aby mohla přivřít oči nad porušováním svých pravidel.
Dnes se obecněji uplatňuje na důvěru, kterou lze vkládat do rozsudků z malých vzorků.
Mezi nejčastěji používané t testy patří:
Jakmile je určena hodnota t, lze najít hodnotu P pomocí tabulky hodnot ze Studentova t-rozdělení.
U nováčků je často nejobtížnější otázkou, zda jsou vzorky nezávislé, nebo závislé. Nezávislé vzorky se obvykle skládají ze dvou skupin bez vztahu. Závislé vzorky se obvykle skládají z odpovídajícího vzorku (nebo „párového“ vzorku) nebo z jedné skupiny, která byla testována dvakrát (opakované měření).
Závislé t-testy se používají také pro párové vzorky, kde se dvě skupiny porovnávají na určité proměnné. Pokud bychom například zkoumali výšky mužů a žen ve vztahu, obě skupiny se porovnávají na stavu vztahu. To by vyžadovalo závislý t-test, protože se jedná o párový vzorek (jeden muž v páru s jednou ženou). Případně bychom mohli přijmout 100 mužů a 100 žen, bez vztahu mezi konkrétním mužem a konkrétní ženou; v tomto případě bychom použili nezávislý test vzorků.
Dalším příkladem porovnávaného vzorku by bylo vzít dvě skupiny studentů, porovnat každého studenta v jedné skupině se studentem v druhé skupině na základě výsledku testu úspěšnosti, a pak zkoumat, kolik každý student čte. Příkladem dvojice mohou být dva studenti, kteří mají skóre 90 a 91 nebo dva studenti, kteří mají skóre 45 a 40 ve stejném testu. Hypotéza by byla, že studenti, kteří si v testu vedli dobře, mohou nebo nemusí číst více. Případně bychom mohli přijmout studenty s nízkým skóre a studenty s vysokým skóre ve dvou skupinách a posoudit jejich počty čtení nezávisle.
Příkladem opakovaných opatření t-testu by bylo, kdyby jedna skupina byla předem a následně testována. (Tento příklad se vyskytuje ve vzdělávání poměrně často.) Pokud by chtěl učitel zkoumat vliv nové sady učebnic na studentské výsledky, (s)mohl by testovat třídu na začátku roku (pretest) a na konci roku (posttest). Byl by použit závislý t-test, který by považoval pretest a posttest za shodné proměnné (porovnány studentem).
Tato rovnice se používá pouze v případě, že jsou obě velikosti vzorku (tedy n nebo počet účastníků každé skupiny) stejné.
Kde s je velká směrodatná odchylka (nebo souhrnná směrodatná odchylka vzorku), 1 = skupina jedna, 2 = skupina dvě. Jmenovatel je směrodatná chyba rozdílu mezi dvěma průměry. Pro testování významnosti jsou stupně volnosti pro tento test 2n − 2, kde n = # účastníků v každé skupině.
Tato rovnice se používá pouze v případě, že velikost obou vzorků není stejná. Předpokládá se, že obě rozdělení mají stejný rozptyl. (Pokud je tento předpoklad porušen, viz níže.) Statistiku t, která má otestovat, zda se průměry liší, lze vypočítat následovně:
Kde s2 je nezkreslený odhad rozptylu, n = počet účastníků, 1 = skupina jedna, 2 = skupina dvě. n − 1 je počet stupňů volnosti pro každou skupinu a celková velikost vzorku minus 2 je celkový počet stupňů volnosti, který se používá při testování významnosti.
Úroveň statistické významnosti spojená s hodnotou t vypočítanou tímto způsobem je pravděpodobnost, že za nulové hypotézy stejných průměrů by absolutní hodnota t mohla být tak velká nebo větší jen náhodou – jinými slovy, je to dvousečný test, který testuje, zda jsou průměry odlišné, když jeden nebo druhý může být větší, pokud jsou odlišné (viz Press et al, 1999, str. 616).
Tato rovnice se používá, když jsou vzorky závislé; to znamená, když je jen jeden vzorek, který byl testován dvakrát (opakované měření) nebo když jsou dva vzorky, které byly spárovány nebo se spárovaly.
Pro tuto rovnici je nutné vypočítat rozdíly mezi všemi dvojicemi. Dvojice jsou buď skóre jedné osoby v pretestu a po zkoušce, nebo jedné osoby ve skupině odpovídající jiné osobě v jiné skupině (viz tabulka). V rovnici se používá průměr (XD) a směrodatná odchylka (sD) těchto rozdílů.
Náhodný vzorek šroubů má závaží
Vypočítejte 95% interval spolehlivosti pro průměrnou hmotnost populace.
Předpokládejme, že populace je rozdělena jako N(μ, σ2).
Průměrná hmotnost vzorků je 30,015 se směrodatnou odchylkou 0,0497. Ze střední hodnoty a prvních pěti hmotností je možné vypočítat šestou hmotnost. V důsledku toho existuje pět stupňů volnosti.
Alternativy ke zkoušce t
Připomeňme, že t test může být použit k testování rovnosti prostředků dvou normálních populací s neznámou, ale rovnou, rozptyl.