Distribuce vzorků

Výběrové rozdělení je ve statistice rozdělení pravděpodobnosti, při opakovaném výběrovém souboru, dané statistiky (číselná veličina vypočtená z hodnot dat ve výběrovém souboru).

Vzorec pro rozložení vzorků závisí na rozložení souboru, uvažované statistice a použité velikosti vzorku. Přesnější formulace by hovořila o rozložení statistiky pro všechny možné vzorky dané velikosti, nejen „při opakovaném odběru“.

Vezměme si například velmi velkou normální populaci (takovou, která se řídí tzv. zvonovou křivkou). Předpokládejme, že opakovaně odebereme vzorky dané velikosti z populace a vypočteme výběrový průměr (aritmetický průměr hodnot údajů) pro každý vzorek. Různé vzorky povedou k různým výběrovým průměrům. Rozložení těchto průměrů je „výběrové rozložení výběrového průměru“ (pro danou velikost vzorku). Toto rozložení bude normální, protože populace byla normální. (Podle centrální limitní věty, pokud populace není normální, ale „dostatečně dobře vychovaná“, bude výběrové rozložení výběrového průměru stále přibližně normální za předpokladu, že velikost vzorku je dostatečně velká.)

Směrodatná odchylka vzorkovacího rozdělení se označuje jako
směrodatná chyba a lze ji odhadnout pomocí vzorce:

kde je směrodatná odchylka populačního rozdělení
a N je velikost (počet položek) ve vzorku.

Velmi důležitým důsledkem tohoto vzorce je, že velikost vzorku (4×) musíte zčtyřnásobit, abyste dosáhli poloviční (1/2) chyby měření. Při navrhování
statistických studií, kde jsou faktorem náklady, to může mít vliv na
pochopení kompromisů mezi náklady a přínosy.

Případně zvažte výběrový medián ze stejné populace. Má odlišné rozložení vzorků, které obecně není normální (ale za určitých okolností může být blízké).

Doporučujeme:  Krystalizace (láska)