Statistická náhodnost

Číselná posloupnost je prý statisticky náhodná, pokud neobsahuje žádné rozpoznatelné vzory nebo pravidelnosti; posloupnosti, jako jsou výsledky ideálního die rollu, nebo číslice Pi (pokud můžeme říct) vykazují statistickou náhodnost.

Statistická náhodnost nemusí nutně znamenat „skutečnou“ náhodnost, tj. objektivní nepředvídatelnost. Pseudorandomnost je dostatečná pro mnoho použití.

Někdy se rozlišuje mezi globální náhodností a lokální náhodností. Většina filozofických koncepcí náhodnosti je „globální“ – jsou založeny na myšlence, že „v dlouhodobém horizontu“ by sekvence vypadala skutečně náhodně, i když by určité sekvence nevypadaly náhodně (například v „skutečně“ náhodné sekvenci o téměř nekonečné délce je pravděpodobné, že by existovaly dlouhé sekvence, které by neměly nic než nuly, i když celkově by sekvence mohla být „náhodná“). „Lokální“ náhodnost odkazuje na myšlenku, že mohou existovat minimální délky sekvencí, ve kterých se aproximují „náhodná“ rozdělení. Dlouhé úseky stejných číslic, dokonce i ty, které jsou generovány „skutečně“ náhodnými procesy, by zmenšily „lokální náhodnost“ vzorku (ta by mohla být lokálně náhodná pouze pro sekvence o 10 000 číslicích; například sekvence menší než 1 000 by se nemusely jevit jako „náhodné“ vůbec).

Není tak dokázáno, že sekvence vykazující vzor není statisticky náhodná. Podle principů Ramseyho teorie musí dostatečně velké objekty nutně obsahovat danou strukturu („úplná porucha je nemožná“).

Právní předpisy týkající se hazardních her ukládají výherním automatům určité normy statistické náhodnosti.

Kontrast s algoritmickou náhodností.

První testy náhodných čísel publikovali M.G. Kendall a Bernard Babington Smith v časopise Journal of the Royal Statistical Society v roce 1938. Byly postaveny na statistických nástrojích, jako je Pearsonův chi-kvadrát test, který byl vyvinut s cílem rozlišit, zda experimentální jevy odpovídají nebo neodpovídají jejich teoretické pravděpodobnosti (Pearson vyvinul svůj test původně tím, že ukazuje, že řada experimentů s kostkami od W.F.R. Weldona nevykazovala „náhodné“ chování).

Doporučujeme:  Ostrovy paměti

Kendallovy a Smithovy původní čtyři testy byly testy hypotéz, které braly jako svou nulovou hypotézu myšlenku, že každé číslo v dané náhodné posloupnosti má stejnou šanci na výskyt a že různé další vzory v datech by měly být také rovnoměrně rozloženy.

Pokud byla daná sekvence schopna projít všemi těmito testy v daném stupni významnosti (zpravidla 5%), pak byla vyhodnocena jejich slovy jako „lokálně náhodná“. Kendall a Smith odlišili „lokální náhodnost“ od „skutečné náhodnosti“ v tom, že mnoho sekvencí generovaných skutečně náhodnými metodami nemuselo zobrazovat „lokální náhodnost“ v daném stupni – velmi velké sekvence mohly obsahovat mnoho řádků jedné číslice. Ta mohla být „náhodná“ v měřítku celé sekvence, ale v menším bloku by nebyla „náhodná“ (neprošla by jejich testy) a byla by pro řadu statistických aplikací nepoužitelná.

Jak se množiny náhodných čísel stávaly stále běžnějšími, používaly se další testy, zvyšující se sofistikovanosti. Některé moderní testy vykreslují náhodné číslice jako body v trojrozměrné rovině, které pak mohou být otočeny, aby hledaly skryté vzory. V roce 1995 statistik George Marsaglia vytvořil sadu testů známou jako Diehardovy testy, které distribuuje s CD-ROM o 5 miliardách pseudonáhodných čísel.