Nezahrnutí všech účastníků do analýzy může zkreslit výsledky studie. Většina studií však nepřináší dokonalá data. „K porušení protokolu“ může dojít, například když pacienti nedostanou úplnou intervenci nebo správnou intervenci nebo je omylem náhodně přiřazeno několik nezpůsobilých pacientů. Navzdory skutečnosti, že většina klinických studií je pečlivě naplánována, může se během provádění studie objevit mnoho problémů. Některé příklady jsou následující:
Analýza takto léčených subjektů má obecnou představu srovnání subjektů s léčebným režimem, který jim byl přidělen. Nezohledňuje, jaká léčba jim byla pro léčbu přidělena.
Randomizované klinické studie analyzované metodou intention-to-treat (ITT) poskytují spravedlivé srovnání mezi léčebnými skupinami, protože zamezují zkreslení spojenému s ne-náhodnou ztrátou účastníků. Základním principem ITT je, že účastníci studií by měli být analyzováni ve skupinách, do kterých byli randomizováni, bez ohledu na to, zda obdrželi nebo dodrželi přidělenou intervenci. Nicméně, zkoušející lékaři mají často potíže s přijetím analýzy ITT kvůli problémům klinických studií, jako jsou chybějící údaje nebo dodržování protokolu.
Tato analýza může být omezena pouze na účastníky, kteří splňují protokol v podmínkách způsobilosti, intervencí a hodnocení výsledků. Tato analýza je známá jako analýza „on-treatment“ nebo „per protocol“. Také per-protocol omezuje srovnání léčby na ideální pacienty, tedy na ty, kteří se dokonale drželi pokynů pro klinické hodnocení, jak je stanoveno v protokolu. Tato populace se klasicky nazývá per-protocol populace a analýza se nazývá per-protocol-analýza. per-protocol analýza předpokládá určení biologického účinku nového léku. Nicméně omezením analýzy na vybranou populaci pacientů neukazuje praktickou hodnotu nového léku.
Jedním z nejdůležitějších problémů při analýze klinického hodnocení je výskyt odpadlíků. Podle Helsinské deklarace se pacienti klinických hodnocení musí účastnit zcela dobrovolně a musí mít právo kdykoliv z hodnocení odejít. Tento etický imperativ činí z chybějících údajů nevyhnutelný problém klinických hodnocení a vyžaduje vhodné analytické metody, aby se s nimi dalo počítat. Jelikož pacienti často odpadávají, protože zjistí, že jim léčba zřejmě nezabírá, nebo protože způsobuje škodlivé vedlejší účinky, chybějící údaje často korelují s účinností nebo bezpečností léčby. Tento typ selektivního zkreslení činí spolehlivé posouzení výsledků klinického hodnocení obzvláště obtížným. Metody k řešení chybějících údajů vytvářejí předpoklady o vztahu mezi odpadlíky a výsledky studie, aby se dospělo k výsledkům, které chybějící údaje zohledňují. Vzhledem k tomu, že předpoklady, na nichž je konkrétní metoda založena, mohou být pro danou studii nevhodné, je k řešení problému zapotřebí péče a odborných znalostí.
Poslední provedená pozorování
Jednou z metod, jak pracovat s chybějícími daty, je jednoduše imputovat nebo vyplnit hodnoty na základě existujících dat. Standardní metodou je metoda Last-Observation-Carried-Forward (LOCF).
Metoda LOCF umožňuje analýzu dat. Nedávné výzkumy však ukazují, že tato metoda poskytuje zkreslený odhad léčebného účinku a podceňuje variabilitu odhadovaného výsledku. Jako příklad předpokládejme, že po základním pozorování existuje 8 týdenních hodnocení. Pokud pacient ze studie po třetím týdnu odstoupí, pak se tato hodnota „přenese“ a předpokládá se, že se jedná o jeho skóre za 5 chybějících datových bodů. Předpokladem je, že se pacienti postupně zlepšují od začátku studie až do konce, takže přenesení mezihodnoty je konzervativním odhadem toho, jak dobře by si daná osoba vedla, kdyby ve studii zůstala. Výhody přístupu LOCF jsou tyto:
Národní akademie věd však v poradní zprávě Úřadu pro kontrolu potravin a léčiv o chybějících údajích v klinických studiích doporučila nekritické používání metod, jako je LOCF, a uvedla, že „metody jednoduché imputace, jako je poslední provedené pozorování a základní provedené pozorování, by neměly být používány jako primární přístup k léčbě chybějících údajů, pokud předpoklady, které jsou jejich základem, nejsou vědecky opodstatněné“.
Základní předpoklad, z něhož vychází LOCF – že pacienti, kterým je podávána léčba, se uzdraví, což činí léčení chybějících údajů, jako by minulost pokračovala beze změny, konzervativním – často není pravdivý. Mnoho léků léčí stavy, jako je rakovina, srdeční selhání nebo AIDS, u nichž se očekává, že se pacientům během pozorování přitíží nebo zemřou; a kde úspěch vychází z udržování statu quo, prodloužení života nebo zabránění zhoršení, nikoli z léčení nebo zlepšení. Navíc i léčebné léky mohou mít škodlivé a někdy smrtelné vedlejší účinky a bezpečnostní problémy. U těchto typů zkušebních kontextů může mít nakládání s chybějícími údaji, jako by minulost pokračovala beze změny, za následek přehnanou účinnost nebo podhodnocení škodlivých bezpečnostních problémů, což zkresluje výsledky způsoby, díky nimž se zkoumaná léčba jeví bezpečnější nebo účinnější, než ve skutečnosti je.
Kromě toho, i když nepřidávají nevhodné zkreslení, jednoduché metody imputace přeceňují přesnost a spolehlivost odhadů a schopnost pokusu posoudit ošetření. Pokud údaje chybí, snižuje se velikost vzorku, na němž jsou odhady založeny. Jednoduché metody imputace tento pokles velikosti vzorku nezohledňují, a proto mají tendenci podceňovat variabilitu výsledků.
Vícenásobné metody imputace
Poradní panel Národní akademie věd místo toho doporučil metody, které poskytují platnou chybovost typu I za explicitně uvedených předpokladů s přihlédnutím ke stavu chybějících údajů a použití metod vícenásobné imputace založených na všech údajích dostupných v modelu. Doporučil rozsáhlejší používání metod Bootstrap a generalizovaných odhadovacích rovnic, kdykoli lze odůvodnit předpoklady, na nichž jsou založeny, jako například Missing at Random pro metody GEE. Doporučil shromažďovat pomocné údaje, o nichž se má za to, že jsou spojeny s výpadky, aby byly k dispozici robustnější a spolehlivější modely, shromažďovat informace o důvodu výpadku; a pokud je to možné, sledovat výpadky a získávat údaje o výsledcích účinnosti. A konečně doporučil analýzy citlivosti jako součást zpráv z klinických studií k posouzení citlivosti výsledků na předpoklady o mechanismu chybějících údajů.
Metody doporučené ve zprávě Národní akademie věd jsou sice novější, robustnější a budou fungovat za širší škály podmínek než metody jednoduché imputace, jako je LOCF, ale žádná známá metoda pro zacházení s chybějícími údaji není platná za všech podmínek. Jak poznamenala Mezinárodní konference o harmonizaci E9 Guidance on Statisticial Principals for Clinical Trials z roku 1998: „Bohužel nelze doporučit žádné univerzálně použitelné metody pro zacházení s chybějícími hodnotami.“ Odborný statistický a lékařský úsudek musí vybrat metodu, která je nejvhodnější pro konkrétní zkušební podmínky dostupných nedokonalých technik, v závislosti na cílech, koncových bodech, statistických metodách a kontextu konkrétního pokusu.