Pracovní charakteristika přijímače

V teorii detekce signálu je provozní charakteristika přijímače (ROC), také provozní křivka přijímače, grafické znázornění citlivosti vs. (1 – specificita) pro binární třídící systém, protože jeho rozlišovací práh je různý. ROC může být také reprezentován ekvivalentně znázorněním zlomku pravdivých pozitiv (TP) vs. zlomku pravdivých negativů (TN). Charakteristika operátora přijímače využití je také běžná.

Křivky ROC se používají k vyhodnocení výsledků předpovědi a poprvé byly použity při studiu diskriminačních systémů pro detekci rádiových signálů za přítomnosti hluku ve 40. letech, po útoku na Pearl Harbor. Počáteční výzkum byl motivován touhou zjistit, jak američtí „operátoři přijímačů“ RADAR japonský letoun minuli.

V šedesátých letech se začaly používat v psychofyzice, k hodnocení lidské (a občas i zvířecí) detekce slabých signálů. Ukázaly se také jako užitečné pro hodnocení výsledků strojového učení, jako je hodnocení internetových vyhledávačů. Jsou také hojně používány v epidemiologii a lékařském výzkumu a jsou často zmiňovány ve spojení s medicínou založenou na důkazech.

Nejlepší možná metoda predikce by přinesla graf, který by byl bodem v levém horním rohu prostoru ROC, tj. 100% citlivost (jsou nalezeny všechny pravdivé pozitivy) a 100% specificita (nejsou nalezeny žádné falešné pozitivy). Zcela náhodný prediktor by dal přímku pod úhlem 45 stupňů od vodorovné roviny, zleva zdola doprava: je to proto, že při zvýšení prahu by byl vpuštěn stejný počet pravdivých a falešných pozitivů. Výsledky pod touto nediskriminační čárou by naznačovaly detektor, který by dával trvale špatné výsledky, a proto by mohl být jednoduše použit k vytvoření detektoru, který by dával užitečné výsledky převrácením svých rozhodnutí.

Jak lze interpretovat křivku ROC

Někdy se ROC používá ke generování souhrnné statistiky. Tři běžné verze jsou:

ROC křivka tří prediktorů epitopů

Jakýkoli pokus o shrnutí křivky ROC do jednoho čísla však ztrácí informace o struktuře kompromisů konkrétního diskriminačního algoritmu.

Komunita strojového učení nejčastěji používá statistiku ROC AUC. Tento ukazatel lze interpretovat jako pravděpodobnost, že když náhodně vybereme jeden pozitivní a jeden negativní příklad, klasifikátor přiřadí kladnému příkladu vyšší skóre než negativnímu.
V inženýrství je často preferována oblast mezi křivkou ROC a čárou nediskriminace, kvůli svým užitečným matematickým vlastnostem jako neparametrická statistika. Tato oblast je často jednoduše známá jako diskriminace.
V psychofyzice je nejčastěji používaným ukazatelem.

Obrázek vpravo ukazuje použití ROC grafů pro rozlišení mezi kvalitou různých algoritmů pro předpovídání epitopů. Pokud chcete objevit alespoň 60% epitopů ve virovém proteinu, můžete z grafu vyčíst, že přibližně 1/3 výstupu by byla falešně označena jako epitop. Informace, která v tomto grafu není viditelná, je, že osoba, která algoritmy používá, ví, jaké prahové nastavení dává určitý bod v ROC grafu.