Ve statistice je matoucí proměnná (také matoucí faktor, skrytá proměnná, číhající proměnná, matoucí nebo matoucí) cizí proměnná ve statistickém modelu, která koreluje (pozitivně nebo negativně) jak se závislou proměnnou, tak s nezávislou proměnnou. Takový vztah mezi dvěma pozorovanými proměnnými se označuje jako nepravdivý vztah. V případě hodnocení rizik hodnotících velikost a povahu rizika pro lidské zdraví je důležité kontrolovat matoucí, aby se izoloval účinek konkrétního nebezpečí, jako je potravinářská přídatná látka, pesticid nebo nový lék. Pro prospektivní studie je obtížné získat a prověřit dobrovolníky se stejným zázemím (věk, strava, vzdělání, geografie atd.), a v historických studiích může být podobná variabilita. Vzhledem k neschopnosti kontrolovat variabilitu dobrovolníků a studií na lidech je matoucí zvláštní výzvou.
Například předpokládejme, že existuje statistický vztah mezi spotřebou zmrzliny a počtem utonutí za dané období. Tyto dvě proměnné mají mezi sebou pozitivní korelaci.
Tato kauzální struktura je zdaleka největším přispěvatelem k pozorované korelaci, a protože sezóna je léto je zdaleka největším přispěvatelem k teplému počasí, letní čas je hlavní příčinou drtivé většiny každého pozorovaného nárůstu.
Zmatečnost při posuzování rizik
Při posuzování rizik mají faktory, jako je věk, pohlaví a úroveň vzdělání, často vliv na zdravotní stav, a proto by měly být kontrolovány. Kromě těchto faktorů nemusí výzkumníci zvažovat ani mít přístup k údajům o jiných příčinných faktorech. Příkladem je studie kouření tabáku na lidské zdraví. Kouření, pití alkoholu a strava jsou činnosti související s životním stylem. Posouzení rizik, které se zabývá účinky kouření, ale nekontroluje konzumaci alkoholu nebo stravu, může riziko kouření přecenit. Kouření a zahanbení jsou přezkoumávány v posouzeních pracovních rizik, jako je bezpečnost těžby uhlí. Pokud v určitém zaměstnání není velká vzorová populace nekuřáků nebo nepijáků, může být posouzení rizik zaujaté ke zjištění negativního vlivu na zdraví.
Vzájemné hodnocení je proces, který může pomoci při snižování případů matoucích. Je to proces hodnocení ustanovení, pracovního procesu nebo výstupu jednotlivce nebo kolektivu působícího ve stejné oblasti jako recenzent (recenzenti). I když nejde o experimentální kontrolu matoucích, protože vzájemné hodnocení se děje po dokončení experimentu, vzájemné hodnocení může odhalit případy matoucích ex post facto, testováním schopnosti reprodukovat výsledky a hodnocením náhody.
Všechny tyto metody mají své nevýhody:
Zmatení podle indikace:
Vyhodnocení účinků léčby z pozorovacích dat je problematické. Prognostické faktory mohou ovlivnit
rozhodování o léčbě, což vede k typu zkreslení označovanému jako „zmátnutí podle indikace“. Ovládání u známých prognostických
faktorů může tento problém snížit, ale vždy je možné, že zapomenutý nebo neznámý faktor nebyl zahrnut
nebo že faktory působí komplexně. Zmatení podle indikace bylo popsáno jako nejdůležitější omezení
pozorovacích studií účinků léčby. Randomizované studie nejsou ovlivněny zmátnutím podle
indikace.
Snížení potenciálu vzniku matoucích jevů
Snížení potenciálu výskytu a účinku matoucích faktorů lze dosáhnout zvýšením typů a počtu srovnání provedených v analýze. Je nepravděpodobné, že by se matoucí účinky vyskytly a působily podobně ve více časech a na více místech.[citace nutná] Prostředí lze také podrobně charakterizovat na místech studie, aby bylo zajištěno, že místa jsou ekologicky podobná, a tudíž je méně pravděpodobné, že budou mít matoucí proměnné. A konečně lze studovat vztah mezi proměnnými prostředí, které případně matou analýzu, a naměřenými parametry. Informace týkající se proměnných prostředí lze pak použít v modelech specifických pro konkrétní místa k identifikaci zbytkového rozptylu, který může být způsoben skutečnými účinky.
Tato učebnice má pěkný přehled o matoucích faktorech a jak je zohlednit při navrhování experimentů:
Průměr (Aritmetika, Geometrie) – Medián – Režim – Výkon – Odchylka – Směrodatná odchylka
Testování hypotéz – Význam – Nullova hypotéza/Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu
Funkce přežití – Kaplan-Meier – Logrank test – Četnost selhání – Proporcionální modely nebezpečnosti
Normal (zvonová křivka) – Poisson – Bernoulli
Matoucí veličina – Pearsonův korelační koeficient produktového momentu – Rank korelace (Spearmanův korelační koeficient hodnosti, Kendall tau korelační koeficient hodnosti)
Lineární regrese – Nelineární regrese – Logistická regrese