Jednoznačně nejsilnější test

Ve statistickém testování hypotéz je jednotně nejsilnější (UMP) test hypotéz, který má největší sílu mezi všemi možnými testy dané velikosti α. Například podle Neymanova-Pearsonova lemmy je pro testování jednoduchých (bodových) hypotéz test pravděpodobnostního poměru UMP.

Dovolit značí náhodný vektor (odpovídající měření), převzaté z parametrizované rodiny hustoty pravděpodobnosti funkcí nebo pravděpodobnostních hmotnostních funkcí , Který závisí na neznámém deterministickém parametru . Parametr prostor je rozdělen do dvou disjunktních souborů a . Dovolit značí hypotézu, že , A nechť značí hypotézu, že .
Binární test hypotéz se provádí pomocí testovací funkce .

což znamená, že je v platnosti, pokud měření a že je v platnosti, pokud měření .
je disjunktní pokrytí měřicího prostoru.

Zkušební funkce je UMP velikosti, pokud pro jinou zkušební funkci máme:

Karlin-Rubinova věta může být považována za rozšíření Neymanova-Pearsonova lemma pro složené hypotézy. Vezměme si skalární měření s funkcí hustoty pravděpodobnosti, která je parametrizována skalárním parametrem θ, a definujme poměr pravděpodobnosti .
Pokud je monotónní neklesající pro jakoukoli dvojici (což znamená, že čím větší je, tím pravděpodobnější je), pak prahový test:

je UMP test velikosti α pro testování

Všimněte si, že přesně stejný test je také UMP pro testování

Důležitý případ: exponenciální rodina

Ačkoli se Karlin-Rubinova teorie může zdát slabá kvůli svému omezení na skalární parametr a skalární měření, ukazuje se, že existuje celá řada problémů, pro které platí věta. Zejména jednorozměrná exponenciální rodina funkcí hustoty pravděpodobnosti nebo pravděpodobnostní hmotnostní funkce má monotónní neklesající poměr pravděpodobnosti v dostatečné statistice T(x), za předpokladu, že neklesá.

Nechť označují i.i.d. normálně distribuované -dimenzionální náhodné vektory se střední a kovarianční maticí . Pak máme

který je přesně ve formě exponenciální rodiny znázorněné v předchozím oddíle, přičemž dostačující statistika je

Tedy, jsme k závěru, že test

je UMP test velikosti pro testování vs.

Nakonec poznamenáváme, že obecně testy UMP neexistují pro vektorové parametry nebo pro oboustranné testy (test, ve kterém jedna hypotéza leží na obou stranách alternativy). Proč tomu tak je?

Důvodem je, že v těchto situacích je nejsilnější test dané velikosti pro jednu možnou hodnotu parametru (např. pro kde ) jiný než nejsilnější test stejné velikosti pro jinou hodnotu parametru (např. pro kde ). Výsledkem je, že žádný test není jednotně nejsilnější.