Tabulka náhodných čísel

Tabulky náhodných čísel byly použity ve statistice pro úlohy, jako jsou vybrané náhodné vzorky. To bylo mnohem efektivnější než manuální generování výběru náhodných vzorků (s kostkami, kartami atd.). V dnešní době byly tabulky náhodných čísel nahrazeny výpočetními generátory náhodných čísel.

Náhodný výběr 300 náhodných číslic z RAND’s 1955 A Million Random Digits with 100,000 Normal Deviates.

Tabulky náhodných čísel mají požadované vlastnosti bez ohledu na to, jak byly z tabulky vybrány: podle řádku, sloupce, úhlopříčky nebo nepravidelně. První takovou tabulku publikoval student Karla Pearsona v roce 1927 a od té doby byla vyvinuta řada dalších takových tabulek. První tabulky byly generovány různými způsoby – jedna (L.H.C. Tippett) brala svá čísla „náhodně“ ze sčítacích registrů, další (R.A. Fisher a Francis Yates) používala čísla „náhodně“ z logaritmických tabulek a v roce 1939 byla publikována sada 100 000 číslic M.G. Kendallem a B. Babingtonem Smithem vyrobená specializovaným strojem ve spojení s lidským operátorem. V polovině čtyřicátých let se RAND Corporation pustila do vývoje velké tabulky náhodných čísel pro použití metodou Monte Carlo a pomocí hardwarového generátoru náhodných čísel vyrobila Milion náhodných číslic se 100 000 normálních odchylek. Tabulka RAND používala elektronickou simulaci rulety připojené k počítači, jejíž výsledky byly poté pečlivě filtrovány a testovány před tím, než byly použity k vygenerování tabulky. Tabulka RAND byla důležitým průlomem v doručování náhodných čísel, protože tak velká a pečlivě připravená tabulka nikdy předtím nebyla k dispozici (největší dříve publikovaná tabulka byla desetkrát menší) a protože byla dostupná i na děrných štítcích IBM, což umožňovalo její použití v počítačích. V padesátých letech byl hardwarový generátor náhodných čísel s názvem ERNIE použit k losování britských čísel v loteriích.

První „testování“ náhodných čísel na statistickou náhodnost bylo vyvinuto M.G. Kendallem a B. Babingtonem Smithem koncem 30. let a bylo založeno na hledání určitých typů pravděpodobnostních očekávání v dané posloupnosti. Nejjednodušší test se měl ujistit, že jsou přítomna zhruba stejná čísla 1s, 2s, 3s, atd.; složitější testy se zabývaly počtem číslic mezi po sobě jdoucími nulami a porovnávaly celkové počty s jejich očekávanými pravděpodobností. V průběhu let byly vyvinuty složitější testy. Kendall a Smith také vytvořili pojem lokální náhodnosti, kdy by byla daná množina náhodných čísel rozdělena a testována v segmentech. V jejich množině 100 000 čísel byly například dva z tisíců poněkud méně „lokálně náhodné“ než zbytek, ale množina jako celek by svými testy prošla. Kendall a Smith doporučili svým čtenářům, aby v důsledku toho nepoužívali tyto konkrétní tisíce sami.

Doporučujeme:  Karl Popper

Pokud je proces filtrování a testování pečlivě připraven, odstraní z hardwarově generovaných původních čísel jakékoliv znatelné zkreslení nebo asymetrii, aby takové tabulky poskytovaly nejspolehlivější náhodná čísla, která má příležitostný uživatel k dispozici.

Všimněte si, že jakákoliv zveřejněná (nebo jinak přístupná) tabulka náhodných dat je nevhodná pro kryptografické účely, protože dostupnost čísel je činí efektivně předvídatelnými, a proto je jejich vliv na kryptosystém také předvídatelný. Naproti tomu skutečně náhodná čísla, která jsou přístupná pouze zamýšlenému enkodéru a dekodéru, umožňují doslova nerozluštitelné šifrování podobného nebo menšího množství smysluplných dat (pomocí jednoduché operace exkluzivní-OR).