Korelace rozdílu pořadí – Dobrá psychoterapie

V zásadě je ρ pouze zvláštním případem Pearsonova koeficientu součin-moment, ve kterém jsou dva soubory dat převedeny na žebříčky a před výpočtem koeficientu. V praxi se však pro výpočet ρ obvykle používá jednodušší postup. Surové skóre se převede na žebříčky a vypočítají se rozdíly mezi žebříčky jednotlivých pozorování u obou proměnných.

Pokud neexistují žádné vázané hodnosti, tj.

Pokud existují svázané hodnosti, je třeba místo tohoto vzorce použít klasický Pearsonův korelační koeficient mezi hodnostmi:

Příklad zprůměrování řad

V níže uvedené tabulce si všimněte, jak pořadí hodnot, které jsou stejné, je průměrem toho, co by jejich pořadí jinak bylo.

V tomto případě nemůžeme použít zkratkový vzorec (kvůli vázaným řadám v datech) a musíme použít druhý, product-moment formulář.

Surová data použitá v tomto příkladu jsou uvedena níže, kde chceme vypočítat korelaci mezi IQ někoho s počtem hodin strávených před televizí za týden.

Prvním krokem je seřadit tato data podle druhého sloupce. Dále se vytvoří další dva sloupce ( a ). Poslednímu z těchto sloupců () se přidělí 1,2,3,…n a pak se data seřadí podle prvního původního sloupce (). Prvnímu z nově vytvořených sloupců () se přidělí 1,2,3,…n. Pak se vytvoří sloupec, který udrží rozdíly mezi dvěma sloupci pořadí ( a ). Nakonec by se měl vytvořit další sloupec. Jedná se pouze o sloupec na druhou.

Po provedení tohoto procesu s ukázkovými daty byste měli skončit s něčím jako:

Hodnoty ve sloupci mohou být nyní přidány k nalezení . Hodnota n je 10. Takže tyto hodnoty mohou být nyní nahrazeny zpět do rovnice,

který vyhodnocuje, ke kterému ukazuje, že korelace mezi IQ a hodinami strávenými sledováním televize je velmi nízká (téměř žádná korelace). V případě vazeb v původních hodnotách by se tento vzorec neměl používat. Místo toho by se měl Pearsonův korelační koeficient vypočítat z ranků (kde jsou vazby dány ranky, jak je popsáno výše).

Moderní přístup k testování, zda je pozorovaná hodnota ρ výrazně odlišná od nuly (vždy budeme mít 1 ≥ ρ ≥ −1), je vypočítat pravděpodobnost, že by byla větší nebo rovna pozorovanému ρ, vzhledem k nulové hypotéze, pomocí permutačního testu. Tento přístup je téměř vždy lepší než tradiční metody, pokud soubor dat není tak velký, že výpočetní výkon není dostatečný pro generování permutací, nebo pokud algoritmus pro vytváření permutací, které jsou logické podle nulové hypotézy je obtížné vymyslet pro konkrétní případ (ale obvykle jsou tyto algoritmy přímočaré).

Alternativní přístup dostupný pro dostatečně velké velikosti vzorku je aproximace Studentova t-rozdělení se stupni volnosti N-2. Pro velikosti vzorku nad cca 20 je proměnná

má Studentovo t-rozdělení v nulovém případě (nulová korelace). V nenulovém případě (tj. pro testování, zda se pozorované ρ významně liší od teoretické hodnoty, nebo zda se dvě pozorovaná ρ významně liší) jsou testy mnohem méně výkonné, i když t-rozdělení lze opět použít.

Zobecnění Spearmanova koeficientu je užitečné v situaci, kdy existují tři nebo více podmínek, v každé z nich je pozorován určitý počet subjektů a předpovídáme, že pozorování budou mít určité pořadí. Například počet subjektů může být každému zadán tři pokusy při stejném úkolu a předpovídáme, že výkonnost se bude od pokusu k pokusu zlepšovat. Test významnosti trendu mezi podmínkami v této situaci vypracoval E. B. Page a obvykle je označován jako Pageův trend test pro objednané alternativy.

Korespondenční analýza založená na Spearmanově rho

Klasická korespondenční analýza je statistická metoda, která dává skóre každé hodnotě dvou nominálních proměnných, a tak je Pearsonův korelační koeficient mezi nimi maximalizován.

Existuje obdoba této metody, tzv. grade korespondenční analýza, která maximalizuje Spearmanovo rhó nebo Kendallovo tau.

Průměr (Aritmetika, Geometrie) – Medián – Režim – Výkon – Odchylka – Směrodatná odchylka

Testování hypotéz – Význam – Nullova hypotéza/Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu

Funkce přežití – Kaplan-Meier – Logrank test – Četnost selhání – Proporcionální modely nebezpečnosti

Normal (zvonová křivka) – Poisson – Bernoulli

Matoucí veličina – Pearsonův korelační koeficient produktového momentu – Rank korelace (Spearmanův korelační koeficient hodnosti, Kendall tau korelační koeficient hodnosti)

Lineární regrese – Nelineární regrese – Logistická regrese