Modelování strukturálních rovnic (SEM) je statistická technika pro testování a odhad kauzálních vztahů pomocí kombinace statistických dat a kvalitativních kauzálních předpokladů. Tento pohled na SEM formulovali genetik Sewall Wright (1921), ekonomové Trygve Haavelmo (1943) a Herbert Simon (1953) a formálně jej definoval Judea Pearl (2000) pomocí srovnávacího počtu.
Strukturální rovnicové modely (SEM) podporují spíše potvrzující než průzkumné modelování; hodí se tedy spíše pro testování teorie než pro vývoj teorie. Obvykle začíná hypotézou, reprezentuje ji jako model, operacionalizuje zajímavé konstrukty měřicím přístrojem a testuje model. Kauzální předpoklady vložené do modelu mají často falzifikovatelné důsledky, které mohou být testovány
proti datům. S přijatou teorií nebo jinak potvrzeným modelem může být SEM také použit induktivně zadáním modelu a použitím dat pro odhad hodnot volných parametrů. Často počáteční hypotéza vyžaduje úpravu s ohledem na modelové důkazy, ale SEM se zřídka používá čistě pro průzkum.
Mezi jeho přednosti patří schopnost modelovat konstrukty jako latentní proměnné (proměnné, které se neměří přímo, ale v modelu se odhadují z naměřených proměnných, u kterých se předpokládá, že se „napojí“ na latentní proměnné). To umožňuje modeláři explicitně zachytit nespolehlivost měření v modelu, což teoreticky umožňuje přesně odhadnout strukturální vztahy mezi latentními proměnnými. Analýza faktorů, analýza dráhy a regrese, to vše představuje zvláštní případy SEM.
V SEM jsou kvalitativní kauzální předpoklady reprezentovány chybějícími proměnnými v každé rovnici a také mizejícími kovariancemi mezi některými termíny chyby. Tyto předpoklady jsou testovatelné v experimentálních studiích a musí být soudně potvrzeny v observačních studiích.
Alternativní technika pro specifikaci modelů strukturálních rovnic používající modelování cest pomocí parciálních nejmenších čtverců byla implementována do softwaru jako LVPLS (Latent Variable Partial Least Square), PLSGraph, SmartPLS (Ringle et al. 2005) a XLSTAT (Addinsoft, 2008). Někteří mají pocit, že je to vhodnější pro zkoumání dat. Ambiciózněji si projekt TETRAD klade za cíl vyvinout způsob, jak automatizovat hledání možných kauzálních modelů z dat.
Kroky při provádění analýzy SEM
Vzhledem k tomu, že SEM je konfirmační technika, musí být model určen správně na základě typu analýzy, kterou se modelář pokouší potvrdit. Při sestavování správného modelu používá modelář dva různé druhy proměnných, a to exogenní a endogenní proměnné. Rozdíl mezi těmito dvěma typy proměnných je v tom, zda proměnná regreduje na jinou proměnnou, nebo ne. Podobně jako při lineární regresi závislá proměnná (DV) regreduje na nezávislou proměnnou (IV), což znamená, že DV je předpovězena IV. V rámci SEM modelování to znamená, že exogenní proměnná je proměnná, na kterou regreduje jiná proměnná. Exogenní proměnné mohou být rozpoznány v grafické verzi modelu, jako proměnné vysílající šipky, označující, kterou proměnnou předpovídá. Proměnná, která regreduje na proměnné, je vždy endogenní proměnnou, i když je tato stejná proměnná použita jako proměnná, na které se regreduje. Endogenní proměnné jsou rozeznány jako přijímače hrotu šipky v modelu. Skutečnost, že proměnná může hrát v modelu SEM dvojí roli (nezávislá i závislá), způsobuje, že SEM je užitečnější než lineární regrese, protože místo provedení dvou regresí udělá jeden model SEM. SEM má obvykle dvě hlavní části: strukturální model ukazující potenciální kauzální závislosti mezi endogenními a exogenními proměnnými a měřicí model ukazující vztahy mezi latentními proměnnými a jejich indikátory. Například konfirmační modely analýzy faktorů obsahují pouze měřicí část; zatímco křivkové diagramy (které mají být odlišné od lineární regrese) mohou být považovány za SEM, který má pouze strukturální část. Specifikace modelu vymezuje kauzální (ve skutečnosti kontrafaktuální) vztahy mezi proměnnými, které jsou považovány za možné (a proto chtějí být „volné“, aby se lišily) a těmi vztahy mezi proměnnými, které již mají odhadovaný vztah, který lze shromáždit z předchozích studií (tyto vztahy jsou v modelu „pevné“).
Modelář často specifikuje sadu teoreticky přijatelných modelů, aby posoudil, zda je navržený model nejlepší ze sady. Modelář musí nejen zohlednit teoretické důvody pro sestavení modelu tak, jak je, ale musí také vzít v úvahu počet datových bodů a počet parametrů, které musí model odhadnout, aby model identifikoval. Identifikovaný model je model, kde specifická hodnota parametru jedinečně identifikuje model a jinou ekvivalentní formulaci nelze poskytnout jinou hodnotou parametru. Datový bod je proměnná s pozorovaným skóre, jako proměnná obsahující skóre u otázky nebo počet případů, kdy si respondenti kupují auto. Parametr je hodnota zájmu, což může být regresní koeficient mezi exogenní a endogenní proměnnou nebo koeficient zatížení (regresní koeficient mezi ukazatelem a jeho faktorem). Pokud je počet datových bodů menší než počet odhadovaných parametrů, je výsledkem neidentifikovaný model, protože existuje příliš málo referenčních bodů, aby bylo možné zohlednit všechny odchylky v modelu. Řešením je omezit jednu z cest na nulu, což znamená, že již není součástí modelu.
Odhad volných parametrů
Odhad parametrů se provádí porovnáním skutečných kovariančních matic představujících vztahy mezi proměnnými a odhadovanými kovariančními maticemi nejlépe vyhovujícího modelu. Toho se dosáhne numerickou maximalizací vyhovujícího kritéria pomocí metod s maximální pravděpodobností, vážených nejmenších čtverců nebo asymptoticky bez rozdělení.
Toho je často dosaženo pomocí specializovaného SEM analytického programu, jako je SPSS‘ AMOS, EQS, LISREL, Mplus, Mx, sem package in R, nebo SAS PROC CALIS (více informací o SAS PROC CALIS: viz UCLA nebo UCR).
Pomocí programu analýzy SEM lze porovnávat odhadované matice představující vztahy mezi proměnnými v modelu se skutečnými maticemi. Pro tyto účely byly vyvinuty formální statistické testy a fit indexy. Jednotlivé parametry modelu lze také zkoumat v rámci odhadovaného modelu, aby se zjistilo, jak dobře navrhovaný model odpovídá teorii řízení. Většina, i když ne všechny, metody odhadu takové testy modelu umožňují.
Modelové testy jsou však správné pouze za předpokladu, že je model správný. Ačkoli tento problém existuje ve všech testech statistických hypotéz, jeho existence v SEM vedla k rozsáhlé diskusi mezi odborníky na SEM, což vedlo k velké škále různých doporučení ohledně přesné aplikace různých fit indexů a testů hypotéz.
Pro každou míru uložení se vyvinula orientační pravidla týkající se toho, co představuje dobrou shodu mezi modelem a daty. Tato orientační pravidla je často nutné aktualizovat na základě kontextových faktorů, jako je velikost vzorku, poměr indikátorů k faktorům a celková velikost modelu. Míry uložení se liší v několika ohledech. Některé z nich odměňují úspornější modely (tj. modely s omezenějšími parametry). Protože různé míry uložení zachycují různé prvky uložení modelu, je vhodné uvést výběr různých míry uložení.
Model může být nutné upravit, aby se zlepšilo uložení, a tím odhadnout nejpravděpodobnější vztahy mezi proměnnými. Mnoho programů poskytuje indexy modifikací, které hlásí zlepšení uložení, které vyplývá z přidání další cesty k modelu. Modifikace, které zlepšují uložení modelu, jsou pak označeny jako potenciální změny, které mohou být v modelu provedeny. Kromě zlepšení uložení modelu je důležité, aby úpravy měly také teoretický smysl.
Tlumočení a komunikace
Model je pak interpretován a tvrzení o konstrukcích jsou založena na nejlépe padnoucím modelu.
Obezřetnost by měla být vždy brána při tvrzeních o kauzalitě, i když byly provedeny experimenty nebo časově uspořádané studie. Termín kauzální model musí být chápán tak, že znamená: „model, který zprostředkovává kauzální předpoklady“, ne nutně model, který produkuje validované kauzální závěry. Sběr dat ve více časových bodech a použití experimentálního nebo kvazi-experimentálního designu může pomoci vyloučit určité konkurenční hypotézy, ale ani randomizovaný experiment nemůže vyloučit všechny takové hrozby kauzální dedukce. Dobrá shoda s modelem konzistentním s jednou kauzální hypotézou nevylučuje stejně dobrou shodu s jiným modelem konzistentním s jinou kauzální hypotézou. Jakkoli pečlivý výzkumný design může pomoci rozlišit takové konkurenční hypotézy.
Replikace a prodloužení platnosti
Všechny modifikace modelu by měly být před interpretací a sdělením výsledků replikovány a revalidovány.
Srovnání s jinými metodami
Ve strojovém učení může být SEM chápán jako zobecnění lineárně-Gaussových Bayesovských sítí, které vypouští omezení acykličnosti, tj. které umožňuje kauzální cykly.