Selekční zkreslení je statistické zkreslení, při kterém dochází k chybě při výběru jedinců nebo skupin, kteří se zúčastní vědecké studie. Někdy je označováno jako selekční efekt. Termín „selekční zkreslení“ se nejčastěji vztahuje na zkreslení statistické analýzy, které vyplývá z metody sběru vzorků. Pokud se selekční zkreslení nebere v úvahu, pak mohou být určité vyvozené závěry chybné.
Existuje mnoho typů možných výběrových zkreslení, včetně:
Zaujatost výběru je systematická chyba způsobená náhodným výběrem populace, která způsobuje, že u některých členů populace je menší pravděpodobnost zahrnutí než u jiných, což vede k zaujatému vzorku, definovanému jako statistický vzorek populace (nebo nelidských faktorů), ve kterém nejsou všichni účastníci rovnoměrně vyváženi nebo objektivně zastoupeni. Většinou je klasifikován jako podtyp selekční zaujatosti, někdy specificky nazývaný selekční zaujatost výběru vzorku, ale někteří jej klasifikují jako samostatný typ zaujatosti.
Rozlišením, i když ne všeobecně přijímaným, výběrové zkreslení je, že narušuje vnější platnost testu (schopnost jeho výsledků zobecnit na zbytek souboru), zatímco výběrové zkreslení řeší hlavně vnitřní platnost rozdílů nebo podobností zjištěných v daném vzorku. V tomto smyslu chyby, které se vyskytnou v procesu shromažďování vzorku nebo kohorty, způsobují výběrové zkreslení, zatímco chyby v jakémkoli procesu poté způsobují výběrové zkreslení.
Příklady výběrového zkreslení zahrnují vlastní výběr, předběžný screening účastníků studie, diskontování pokusných subjektů/testů, které nedokončily, a migrační zkreslení vyloučením subjektů, které se nedávno přestěhovaly do studijního prostoru nebo z něj.
Attrition bias je druh selekčního zkreslení způsobeného opotřebením (ztrátou účastníků), diskontováním pokusných subjektů/testů, které nedoběhly do konce. Zahrnuje vyřazení, neodpověd (nižší četnost odezvy), vyřazení a odchylky od protokolu. Dává zkreslené výsledky tam, kde je nerovné, pokud jde o expozici a/nebo výsledek. Například při testu dietního programu může výzkumník jednoduše odmítnout každého, kdo ze studie vypadne, ale většina těch, kdo ze studie vypadnou, jsou ti, u nichž to nefungovalo. Odlišný úbytek subjektů v intervenční a srovnávací skupině může změnit charakteristiky těchto skupin a výsledky bez ohledu na zkoumanou intervenci.
Data se filtrují nejen podle návrhu a měření studie, ale i podle nezbytného předpokladu, že musí existovat někdo, kdo studii provádí. V situacích, kdy existence pozorovatele nebo studie koreluje s daty, dochází k výběrovým efektům a vyžaduje se antropická argumentace.
Příkladem je záznam o minulých dopadech na Zemi: pokud velké dopady způsobí hromadné vymírání a ekologické poruchy znemožňující vývoj inteligentních pozorovatelů na dlouhou dobu, nikdo nepozoruje žádné důkazy o velkých dopadech v nedávné minulosti (protože by zabránily inteligentním pozorovatelům ve vývoji). Z toho vyplývá potenciální zkreslení záznamu o dopadech na Zemi. Astronomická existenční rizika by mohla být podobně podceněna kvůli selekčnímu zkreslení a musí být zavedena antropická korekce.
V obecném případě nelze selekční zkreslení překonat pouze statistickou analýzou existujících dat, i když ve zvláštních případech lze použít Heckmanovu korekci. Neformální posouzení stupně selekční zkreslení lze provést zkoumáním korelací mezi exogenními (pozadí) proměnnými a indikátorem léčby. V regresních modelech je to však korelace mezi nepozorovanými determinanty výsledku a nepozorovanými determinanty výběru do vzorku, která zkresluje odhady, a tuto korelaci mezi nepozorovatelnými nelze přímo posoudit pozorovanými determinanty léčby.
Selekční zkreslení úzce souvisí s: