Chyby typu I

Chyba typu I , nazývaná také falešně pozitivní, existuje tehdy, když test nesprávně oznámí, že našel výsledek, kde ve skutečnosti žádný neexistuje.

Míra falešně pozitivních je podíl negativních případů, které byly chybně vykázány jako pozitivní. Je rovna 1 minus specifičnost testu.

Při testování statistických hypotéz je tento zlomek někdy popisován jako velikost testu a je mu dán symbol α.

Falešné pozitivy vs. falešné negativy

Při vývoji detekčních algoritmů (tedy testů) dochází ke kompromisu mezi falešnými pozitivy a falešnými negativy (u nichž není zjištěna skutečná shoda). Prahovou hodnotu lze měnit tak, aby byl algoritmus restriktivnější nebo citlivější. U restriktivních algoritmů hrozí odmítnutí skutečných pozitiv, zatímco u citlivějších algoritmů hrozí přijetí falešných pozitiv.

Falešně pozitivní v medicíně

Falešně pozitivní jsou významným problémem při lékařských testech. V některých případech lze použít dva nebo více testů, z nichž jeden je jednodušší a levnější, ale méně přesný než druhý. Například nejjednodušší testy na HIV a hepatitidu v krvi mají významný podíl falešně pozitivních výsledků. Tyto testy se používají k vyšetření možných dárců krve, ale dražší a přesnější testy se používají v lékařské praxi, aby se zjistilo, zda je člověk skutečně nakažen těmito viry.

Zřejmě nejčastěji diskutovaná falešná pozitiva v medicíně pocházejí z screeningu mamografie, což je test na odhalení rakoviny prsu. Podíl falešně pozitivních mamografických vyšetření v USA dosahuje až 15%, což je nejvíce na světě. Nejnižší podíl na světě je v Holandsku, 1%. Nejnižší podíly jsou obecně v severní Evropě, kde se snímky z mamografie čtou dvakrát a je stanoven vysoký práh pro dodatečné vyšetření. Jedním z důsledků vysokého podílu falešně pozitivních vyšetření v USA je, že za deset let dostane falešně pozitivní mamografické vyšetření polovina amerických žen. Falešně pozitivní mamografické vyšetření je nákladné, v USA se ročně utratí přes 100 milionů dolarů za zbytečné následné vyšetření a léčbu. Způsobují také ženám zbytečnou úzkost. Výzkumy ukázaly, že úzkost spojená s obdržením falešného pozitivního vyšetření se může snížit, pokud se zkrátí doba mezi abnormálním výsledkem a celkovým čistým stavem.

Falešně pozitivní jsou také problematické při biometrických skenech, jako jsou skeny sítnice nebo rozpoznávání obličeje, kdy skener nesprávně identifikuje někoho, kdo se shoduje se známou osobou, buď osobu, která je oprávněna vstoupit do systému, nebo podezřelého z trestného činu.

Falešně pozitivní mohou způsobit vážné a neintuitivní problémy, pokud je hledaný stav vzácný. Pokud má test falešně pozitivní poměr jedna ku deseti tisícům, ale pouze jeden z milionu vzorků (nebo lidí) je skutečně pozitivní, většina „pozitivních“ zjištěných testem bude falešná. Pravděpodobnost, že pozorovaný pozitivní výsledek je falešně pozitivní, může být vypočítána a problém falešně pozitivních prokázán pomocí Bayesovy věty.

Falešné pozitivy při vyhledávání v počítačové databázi

Falešná pozitiva jsou v počítačovém vyhledávání v databázi dokumenty, které jsou vyhledáváním získány navzdory jejich irelevanci k hledané otázce. Falešná pozitiva jsou běžná v fulltextovém vyhledávání, ve kterém vyhledávací algoritmus zkoumá celý text ve všech uložených dokumentech ve snaze najít shodu s jedním nebo více vyhledávanými výrazy zadanými uživatelem.

Nejvíce falešných pozitiv lze připsat nedostatkům přirozeného jazyka, který je často nejednoznačný: termín „domov“ může například znamenat „obydlí osoby“ nebo „hlavní či nejvyšší úroveň stránky na webu“. Míru falešných pozitiv lze snížit pomocí kontrolovaného slovníku, ale toto řešení je drahé, protože slovní zásoba musí být vyvinuta odborníkem a aplikována na dokumenty školenými indexery.

Termín „False positive“ se také používá, když techniky filtrování spamu nebo blokování spamu nesprávně klasifikují legitimní e-mailovou zprávu jako spam a v důsledku toho narušují její doručení.

Opak, False Negative, nastává, když filtrování umožňuje doručení spamového e-mailu do schránky uživatele.

Zatímco většina antispamových taktik dokáže blokovat nebo filtrovat vysoké procento nechtěných e-mailů, dělat to bez vytváření významných falešně pozitivních výsledků je mnohem náročnější úkol.

Běžně odkazovanou podkategorií je „Kritická nepravda-pozitivní“. Tento termín se používá k rozlišení náhodného zablokování hromadných e-mailů, které nemusí být spamem, ale nejsou obecně považovány za kritickou komunikaci, na rozdíl od zpráv mezi uživateli a automatizovaných oznámení transakcí, kde je včasné doručení mnohem důležitější.

Falešná pozitiva a malware

Termín False positive se používá také tehdy, když antivirový software nesprávně klasifikuje soubor jako virus. K nesprávné detekci může dojít buď heuristikou, nebo nesprávným podpisem viru v databázi. Podobné problémy se mohou objevit u antitrojanského nebo antispywarového softwaru.

Falešná pozitiva a vyšetřování duchů

Falešně pozitivní byl přijat paranormálními nebo ghost vyšetřovacími skupinami k popisu fotografie, nahrávky nebo jiného důkazu, který nesprávně vypadá, že má paranormální původ. Jinými slovy, falešně pozitivní je v tomto kontextu vyvrácený kus média (obraz, film, audio nahrávka, atd.), který má normální vysvětlení. Několik stránek poskytuje příklady falešně pozitivních, včetně The Atlantic Paranormal Society (TAPS) a Moorestown Ghost Research.