Podrobná korespondenční analýza

Byl vytvořen v roce 1979 Markem Hillem z britského Institutu pro suchozemskou ekologii (nyní
sloučen do Centra pro ekologii a hydrologii) a implementován v kódovém balíčku FORTRAN nazvaném DECORANA (Detrended Correspondence Analysis), což je metoda korespondenční analýzy. DCA je někdy chybně označována jako DECORANA; nicméně DCA je základní algoritmus, zatímco DECORANA je nástroj pro jeho implementaci.

Problémy, které řeší DCA

Podle Hilla a Gaucha (1980) se DCA používá k potlačení dvou artefaktů, které jsou vlastní většině ostatních multivariačních analýz, když se aplikuje na údaje o gradientu. Příkladem je časová řada rostlinných druhů kolonizujících nové stanoviště; raně po sobě jdoucí druhy jsou nahrazeny středně po sobě jdoucími druhy, pak pozdně po sobě jdoucími druhy (viz příklad níže). Když jsou taková data analyzována standardním řazením, jako je korespondenční analýza

Mimo ekologii se stejné artefakty vyskytují při analýze gradientních dat (např. vlastnosti půdy podél transektu probíhajícího mezi 2 různými geologiemi nebo údaje o chování během životnosti jedince), protože zakřivená projekce je přesnou reprezentací tvaru dat ve vícerozměrném prostoru.

Ter Braak a Prentice (1987, str. 121) citují simulační studii analyzující dvourozměrné modely třídění druhů, což vede k lepšímu výkonu DCA ve srovnání s CA.

Jak DCA řeší problémy

DCA je iterační algoritmus, který se ukázal jako vysoce spolehlivý a užitečný nástroj pro průzkum a shrnutí dat v komunitní ekologii (Shaw 2003). Začíná spuštěním standardní ordinace (CA nebo reciproční průměrování) na datech, aby se vytvořila počáteční podkovovitá křivka, ve které se 1. ordinační osa zkresluje do 2. osy. Poté rozdělí první osu na segmenty (výchozí = 26) a každý segment upraví tak, aby měl střední hodnotu nula na 2. ose – tím se křivka vlastně zploští. Také upraví osu tak, aby konce již nebyly komprimovány vzhledem ke středu, takže 1 DCA jednotka se přibližuje stejné míře obratu po celou cestu daty: pravidlem je, že 4 DCA jednotky znamenají, že v komunitě došlo k celkovému obratu.
Ter Braak a Prentice (1987, str.122) varují před nelineárním přenastavením os kvůli problémům s robustností a doporučují používat pouze snižující-by-polynomy.

Doporučujeme:  Jak překonat citovou prázdnotu, osamělost a smutek

U DCA nejsou k dispozici žádné testy významnosti, i když existuje omezená (kanonická) verze zvaná DCCA, ve které jsou osy donuceny Vícenásobnou lineární regresí, aby korelovaly optimálně s lineární kombinací jiných (obvykle environmentálních) proměnných; to umožňuje testování nulového modelu Monte-Carlo permutační analýzou.

Příklad ukazuje ideální datový soubor: Údaje o druzích jsou v řádcích, vzorky ve sloupcích. Pro každý vzorek podél gradientu je vysazen nový druh, ale jiný druh již není přítomen. Výsledkem je řídká matice, jedničky indikují přítomnost druhu ve vzorku. Kromě okrajů obsahuje každý vzorek pět druhů.

Výsledek Korespondenční analýzy pro ideální datový soubor – oříznutý screenshot z PAST

Graf prvních dvou os výsledku korespondenční analýzy na pravé straně jasně ukazuje nevýhody tohoto postupu: efekt hrany, tj. body jsou seskupeny na okrajích první osy a efekt oblouku.