Rozpoznávání objektů pomocí počítače

Rozpoznávání objektů v počítačovém vidění je úkol najít daný objekt v obraze nebo videosekvenci. Lidé rozeznají množství objektů v obrazech s malou námahou, a to navzdory skutečnosti, že obraz objektů se může poněkud lišit v různých úhlech pohledu, v mnoha různých velikostech / měřítku nebo dokonce i při jejich překladu nebo otočení. Objekty lze dokonce rozeznat, když jsou částečně zakryty z pohledu. Tento úkol je stále výzvou pro počítačové systémy vidění obecně.

Přístupy založené na CAD-like objektových modelech

Detekce hran, prvotní skica, Marr, Mohan and Nevatia, Lowe, Faugeras

Binford (generalizované válce), Biederman (geony), Dickinson, Forsyth a Ponce

Histogramy: Swain a Ballard, Schiele a Crowley, Schneiderman a Kanade, Linde a Lindeberg,
Koenderink a van Doorn, Dalal a Triggs

Přístupy založené na úrokových bodech

Scale-invariant feature transform

David Lowe byl průkopníkem přístupu počítačového vidění k extrakci a použití škálově invariantních SIFT funkcí z obrázků k provedení spolehlivého rozpoznání objektů.

Pytel slov reprezentace

Okenní detekce, 3D nápovědy, kontext, využití internetových dat, nekontrolované učení, rychlá indexace

Metody rozpoznávání objektů mají následující aplikace:

Daniilides a Eklundh, Edelman