Korespondenční analýza

Korespondenční analýza (CA) je vícerozměrná statistická technika navržená Hirschfeldem a později vyvinutá Jeanem-Paulem Benzécrim. Je koncepčně podobná analýze hlavních komponent, ale týká se spíše kategorických než spojitých dat. Podobným způsobem jako analýza hlavních komponent poskytuje prostředek pro zobrazení nebo shrnutí souboru dat ve dvourozměrné grafické podobě.

Všechny údaje by měly být nezáporné a ve stejném měřítku, aby byla CA použitelná, a metoda zachází s řádky a sloupci rovnocenně. Tradičně se používá pro tabulky nepředvídaných událostí – CA rozkládá statistiku chí-kvadrát spojenou s touto tabulkou na ortogonální faktory. Protože CA je popisná technika, lze ji použít na tabulky bez ohledu na to, zda je statistika vhodná.

Podobně jako analýza hlavních komponent, korespondenční analýza vytváří ortogonální komponenty a pro každou položku v tabulce sadu skóre (někdy nazývané faktorové skóre, viz Faktorová analýza). Korespondenční analýza se provádí na kontingenční tabulce C o velikosti m×n, kde m je počet řádků a n je počet sloupců.

Z tabulky C spočítejte množinu vah pro sloupce a řádky (někdy nazývané hmotnosti), kde jsou váhy řádků

Dále spočítejte tabulku S (tzv. stochastická matice), kde C se vydělí součtem C

Nakonec spočítejte tabulku M z S a hmotnosti jako takové

kde označuje konjugát transponovat .

Tabulka M se pak rozkládá zobecněným singulárním rozkladem hodnot, kde levé a pravé singulární vektory jsou omezeny váhami. Váhy jsou diagonální tabulky

kde diagonální prvky jsou a off-diagonální prvky jsou všechny 0.

M se pak rozkládá pomocí všeobecného singulárního rozkladu hodnoty

Faktor skóre pro řádkové položky tabulky C jsou

Rozšíření a aplikace

K dispozici je několik variant CA, včetně detrended correspondence analysis (DCA) a canonical correspondence analysis (CCA). Rozšíření korespondenční analýzy na mnoho kategorických proměnných se nazývá multiple correspondence analysis. Adaptace korespondenční analýzy na problém diskriminace založené na kvalitativních proměnných (tj. ekvivalent discriminantní analýzy pro kvalitativní data) se nazývá discriminantní korespondenční analýza nebo barycentrická discriminantní analýza.

Ve společenských vědách byla korespondenční analýza, a zejména její rozšíření o vícenásobnou korespondenční analýzu, známa mimo Francii prostřednictvím jejího uplatnění francouzským sociologem Pierrem Bourdieuem.