Cramérovo–von Misesovo kritérium

Cramérovo-von Misesovo kritérium je ve statistice kritérium, které se používá pro posouzení správnosti uložení kumulativní distribuční funkce ve srovnání s danou empirickou distribuční funkcí , nebo pro srovnání dvou empirických distribucí. Používá se také jako součást jiných algoritmů, jako je odhad minimální vzdálenosti. Je definováno jako

V aplikacích s jedním vzorkem je teoretické rozdělení a je to empiricky pozorované rozdělení. Alternativně mohou být obě rozdělení empiricky odhadnuta; tomu se říká případ se dvěma vzorky.

Kritérium je pojmenováno po Haraldu Cramérovi a Richardu Edleru von Misesovi, kteří ho poprvé navrhli v letech 1928-1930. Zobecnění na dva vzorky je způsobeno Andersonem.

Cramérův-von Misesův test je alternativou k Kolmogorovovu-Smirnovovu testu.

Cramérův–von Misesův test (jeden vzorek)

Dovolit být pozorované hodnoty, v pořadí podle růstu. Pak statistika je:1153

Pokud je tato hodnota větší než tabulková hodnota, lze odmítnout hypotézu, že data pocházejí z rozdělení.

Upravenou verzí Cramérova–von Misesova testu je Watsonův test, který využívá statistiku U2, kde

Cramérův–von Misesův test (dva vzorky)

Dovolit a být pozorované hodnoty v prvním a druhém vzorku, respektive v pořadí podle růstu. Dovolit být pořadí x je v kombinovaném vzorku, a nechť být pořadí y je v kombinovaném vzorku. Anderson:1149 ukazuje, že

Pokud je hodnota T větší než tabulkové hodnoty,:1154-1159, hypotéza, že oba vzorky pocházejí ze stejného rozdělení, může být odmítnuta. (Některé knihy[upřesněte]

Výše uvedené předpokládá, že neexistují žádné duplicity v , , A sekvence. Tak je unikátní, a jeho hodnost je v seřazeném seznamu . Pokud existují duplicity, a prostřednictvím jsou běh stejných hodnot v seřazeném seznamu, pak jeden společný přístup je midrank metoda: přiřadit každé duplicitní „hodnost“ na . Ve výše uvedených rovnic, ve výrazech a , duplicity lze upravit všechny čtyři proměnné , , , A .