Yuleova–Simonova distribuce

V pravděpodobnosti a statistice je Yuleovo-Simonovo rozdělení diskrétní pravděpodobnostní rozdělení pojmenované po Udny Yuleovi a Herbertu Simonovi. Simon ho původně nazval Yuleovo rozdělení.

Pravděpodobnostní hmotnostní funkce Yule-Simonova (ρ) rozdělení je

pro integer a real , Kde je funkce beta. Ekvivalentně pmf lze psát ve smyslu klesající faktoriál jako

kde je funkce gama. Tedy, pokud je celé číslo,

Parametr lze odhadnout pomocí algoritmu pevného bodu.

Pravděpodobnost hmotnost funkce f má vlastnost, že pro dostatečně velké k máme

To znamená, že ocas Yuleho-Simonova rozdělení je realizací Zipfova zákona: může být použit například k modelování relativní frekvence nejčastějšího slova ve velké sbírce textu, která je podle Zipfova zákona nepřímo úměrná (typicky malé) mocnině .

Yuleho-Simonovo rozdělení vzniklo původně jako limitující rozdělení určitého stochastického procesu, který Yule studoval jako model pro rozdělení biologických taxonů a subtax. Simon tento proces nazval „Yuleho proces“, ale dnes je spíše známý jako preferenční připojovací proces. Preferenční připojovací proces je urnový proces, při kterém jsou kuličky přidávány k rostoucímu počtu uren, přičemž každá kulička je přidělována k urně s pravděpodobností lineární v čísle, které urna již obsahuje.

Distribuce také vzniká jako spojitá směs geometrických distribucí. Konkrétně předpokládejme, že následuje exponenciální distribuce s měřítkem nebo rychlostí :

Yule-Simonova distribuovaná proměnná pak má následující geometrické rozdělení:

pmf geometrického rozdělení je

pro . Yule-Simonovo pmf je pak následující exponenciálně-geometrické rozložení směsi:

Zobecnění původního Yuleova rozdělení dvěma parametry nahrazuje funkci beta neúplnou funkcí beta. Pravděpodobnostní hmotnostní funkce zobecněného Yuleova-Simonova(ρ, α) rozdělení je definována jako

s . Pro obyčejné Yule-Simonovo(ρ) rozdělení se získává jako speciální případ. Použití nekompletní funkce beta má za následek zavedení exponenciální meze v horní části ocasu.