Intraklasická korelace – Dobrá psychoterapie

Tečkovaný graf zobrazující datovou sadu s vysokou mezitřídní korelací. Hodnoty ze stejné skupiny bývají podobné.

Tečkovaný graf zobrazující datovou sadu s nízkou mezitřídní korelací. Neexistuje tendence k tomu, aby hodnoty ze stejné skupiny byly podobné.

Ve statistice je vnitrotřídní korelace (nebo také vnitrotřídní korelační koeficient, zkráceně ICC) popisná statistika, kterou lze použít při kvantitativních měřeních na jednotkách, které jsou uspořádány do skupin. Popisuje, jak silně se jednotky ve stejné skupině navzájem podobají. I když je vnímána jako typ korelace, na rozdíl od většiny ostatních korelačních měřítek pracuje na datech strukturovaných jako skupiny, spíše než na datech strukturovaných jako párová pozorování.

Vnitrotřídní korelace se běžně používá ke kvantifikaci míry, do jaké se jedinci s pevným stupněm příbuznosti (např. úplní sourozenci) navzájem podobají z hlediska kvantitativního znaku (viz dědičnost). Dalším význačným použitím je posouzení konzistence nebo reprodukovatelnosti kvantitativních měření provedených různými pozorovateli měřícími stejnou veličinu.

Nejstarší práce na vnitrotřídních korelacích se zaměřila na případ párových měření a první vnitrotřídní korelační statistika (ICC), která byla navržena, byly úpravy mezitřídní korelace (Pearsonova korelace).

Vezměme si datový soubor sestávající z N párovaných hodnot dat (xn,1, xn,2), pro n = 1, …, N. Korelace v rámci třídy r původně navržená Ronaldem Fisherem je

Pozdější verze této statistiky používaly správné stupně volnosti 2N −1 pro s2 a N −1 pro r, takže s2 se stává nezaujatým a r se stává nezaujatým, pokud je známo s.

Klíčovým rozdílem mezi touto ICC a mezitřídovou (Pearsonovou) korelací je to, že data jsou sdružena za účelem odhadu průměru a rozptylu. Důvodem je to, že v prostředí, kde je žádoucí intratřídová korelace, jsou páry považovány za neuspořádané. Pokud například studujeme podobnost dvojčat, obvykle neexistuje žádný smysluplný způsob, jak seřadit hodnoty pro dvě osoby v rámci dvojice. Stejně jako mezitřídová korelace, bude intratřídová korelace pro párová data omezena na interval [-1, +1].

Korelace v rámci třídy je definována také pro datové soubory se skupinami, které mají více než dvě hodnoty. Pro skupiny, které se skládají ze 3 hodnot, je definována jako

Jak roste počet skupin, rychle roste počet termínů křížového součinu v tomto výrazu, ale ekvivalentní forma

kde K je počet hodnot dat na skupinu, a je výběrový průměr n-té skupiny, je mnohem jednodušší výpočet.
Tato forma je obvykle připisována Harrisovi.
Levý člen je nezáporný, proto musí korelace v rámci třídy splňovat

U velkého K se tento ICC téměř rovná

které mohou být interpretovány jako zlomek celkového rozptylu, který je způsoben rozptylem mezi skupinami.

Existuje celá kapitola, která se týká vnitrotřídní korelace v klasické knize Ronalda Fishera Statistické metody pro výzkumné pracovníky.

Počínaje Ronaldem Fisherem byla mezitřídní korelace posuzována v rámci analýzy rozptylu (ANOVA) a v poslední době v rámci modelů náhodných efektů. Byla navržena řada odhadů ICC. Většinu odhadů lze definovat pomocí modelu náhodných efektů.

kde Yij je jth pozorování v ith skupině, μ je nepozorovaný celkový průměr, αi je nepozorovaný náhodný efekt sdílený všemi hodnotami ve skupině i a εij je nepozorovaný šumový termín. Pro model, který má být identifikován, se předpokládá, že αi a εij mají očekávanou hodnotu nula a nekorelují se navzájem. Také se předpokládá, že αi je identicky rozloženo a εij je identicky rozloženo. Rozptyl αi je označen jako σα2 a rozptyl εij je označen jako σε2.

ICC populace v tomto rámci je

Výhodou rámce ANOVA je, že různé skupiny mohou mít různý počet hodnot dat, což je obtížně zvládnutelné při použití dřívějších statistik ICC. Všimněte si také, že tento ICC je vždy nezáporný, což umožňuje jeho interpretaci jako podílu celkového rozptylu, který je „mezi skupinami“. Tento ICC lze zobecnit tak, aby umožňoval kovariátové efekty, v takovém případě je ICC interpretován tak, že zachycuje v rámci třídy podobnost hodnot dat upravených podle kovariáty .

Byla navržena řada různých statistik ICC, z nichž ne všechny odhadují stejný populační parametr. Proběhla značná debata o tom, které statistiky ICC jsou vhodné pro dané použití, protože mohou přinést výrazně odlišné výsledky pro stejné údaje.

Vztah k Pearsonovu korelačnímu koeficientu

Pokud jde o jeho algebraickou podobu, Fisherův původní ICC je ICC, který se nejvíce podobá Pearsonovu korelačnímu koeficientu. Klíčovým rozdílem mezi oběma statistikami je, že v ICC jsou data vycentrována a škálována pomocí sdruženého průměru a směrodatné odchylky, zatímco v Pearsonově korelaci je každá proměnná vycentrována a škálována podle vlastního průměru a směrodatné odchylky. V párovém datovém souboru, kde neexistuje žádný smysluplný způsob, jak uspořádat obě měření v rámci páru (např. měření provedené na dvou identických dvojčatech), je ICC přirozenějším měřítkem asociace než Pearsonova korelace.

Důležitou vlastností Pearsonovy korelace je, že je invariantní k aplikaci oddělených lineárních transformací na obě srovnávané proměnné. Pokud tedy korelujeme X a Y, kde například Y = 2X + 1, Pearsonova korelace mezi X a Y je 1 – dokonalá korelace. Tato vlastnost nedává ICC smysl, protože neexistuje žádný základ pro rozhodnutí, která transformace je aplikována na každou hodnotu ve skupině. Pokud jsou však všechna data ve všech skupinách podrobena stejné lineární transformaci, ICC se nemění.

Využití při posuzování shody mezi pozorovateli

ICC se používá k hodnocení konzistence nebo shody měření prováděných více pozorovateli, kteří měří stejnou veličinu. Pokud je například několik lékařů požádáno, aby výsledky CT vyšetření hodnotili na známky progrese nádorového onemocnění, můžeme se ptát, nakolik jsou si skóre navzájem konzistentní. Pokud je známa pravda (například pokud by CT vyšetření bylo u pacientů, kteří následně podstoupili výzkumnou operaci), pak by se pozornost obecně soustředila na to, nakolik se skóre lékařů shoduje s pravdou. Pokud není známa pravda, můžeme vzít v úvahu pouze podobnost mezi skóre. Důležitým aspektem tohoto problému je, že existuje variabilita mezi pozorovateli i uvnitř pozorovatele. Variabilita mezi pozorovateli se týká systematických rozdílů mezi pozorovateli – například jeden lékař může pacienty konzistentně hodnotit na vyšší úrovni rizika než ostatní lékaři. Variabilita mezi pozorovateli se týká odchylek skóre konkrétního pozorovatele u konkrétního pacienta, které nejsou součástí systematického rozdílu.

ICC je konstruován tak, aby se vztahoval na vyměnitelná měření – to znamená na seskupené údaje, v nichž neexistuje žádný smysluplný způsob, jak měření uspořádat v rámci skupiny. Při posuzování shody mezi pozorovateli, pokud titíž pozorovatelé hodnotí každý zkoumaný prvek, pak pravděpodobně existují systematické rozdíly mezi pozorovateli, což je v rozporu s pojmem vyměnitelnosti. Pokud se ICC použije v situaci, kdy existují systematické rozdíly, výsledkem je složené měření proměnlivosti mezi pozorovateli a mezi pozorovateli. Jednou ze situací, kdy lze důvodně předpokládat, že výměnnost trvá, by byla situace, kdy se vzorek, který má být ohodnocen, řekněme krevní vzorek, rozdělí na více alikvotních podílů a alikvotní podíly se měří odděleně na stejném přístroji. V tomto případě by výměnnost trvala tak dlouho, dokud by nebyl přítomen žádný účinek v důsledku posloupnosti běhu vzorků.

Vzhledem k tomu, že korelační koeficient v rámci třídy dává při použití s údaji, u nichž nejsou pozorovatelé vyměnitelní, složenou variabilitu mezi pozorovateli a mezi pozorovateli, jsou jeho výsledky v tomto prostředí někdy považovány za obtížně interpretovatelné. Jako vhodnější měřítka shody mezi nevyměnitelnými pozorovateli byla navržena alternativní měřítka, jako je Cohenova statistika kappa, Fleissova kappa a korelační koeficient shody.

Výpočet v softwarových balíčcích

Statistický balíček SPSS může být použit pro výpočet 10 různých typů vnitrotřídní korelace na základě těch, které nastínili McGraw a Wong.