Statistika testu

Testovací statistika je ve statistickém testování hypotéz číselný souhrn souboru dat, který
redukuje data na jednu nebo malý počet hodnot, které mohou být použity k provedení testu hypotéz. Vzhledem k nulové hypotéze a testovací statistice T můžeme specifikovat „nulovou hodnotu“ T0 tak, že hodnoty T blízké T0 představují nejsilnější důkaz ve prospěch nulové hypotézy, zatímco hodnoty T vzdálené od T0 představují nejsilnější důkaz proti nulové hypotéze. Důležitou vlastností testovací statistiky je, že musíme být schopni určit její vzorkovací rozložení podle nulové hypotézy, což nám umožňuje vypočítat hodnoty p.

Například předpokládejme, že chceme vyzkoušet, zda je mince spravedlivá (tj. má stejnou pravděpodobnost, že vyrobí hlavu nebo ocas). Hodíme-li mincí stokrát a zaznamenáme výsledky, mohou být surová data reprezentována jako sekvence 100 hlav a orel. Je-li naším zájmem mezní pravděpodobnost získání hlavy, stačí zaznamenat číslo T ze 100 hodů, které vyrobily hlavu, a použít T0 = 50 jako naši nulovou hodnotu. Přesné vzorkovací rozdělení T je binomické rozdělení, ale pro větší velikosti vzorku lze použít normální aproximaci. Pomocí jednoho z těchto vzorkovacích rozdělení je možné vypočítat buď jednoocasou nebo dvouocasou p-hodnotu pro nulovou hypotézu, že mince je spravedlivá. Všimněte si, že testovací statistika v tomto případě redukuje množinu 100 čísel na jediný číselný souhrn, který lze použít pro testování.

Testovací statistika má některé ze stejných vlastností jako popisná statistika a mnoho statistik lze použít jako testovací statistiky i jako popisné statistiky. Testovací statistika je však speciálně určena pro použití při statistickém testování, zatímco hlavní kvalitou popisné statistiky je, že je snadno interpretovatelná. Některé informativní popisné statistiky, jako je rozsah výběrů, nevytvářejí dobré testovací statistiky, protože je obtížné určit jejich výběrové rozložení.