Rozpoznávání objektů v počítačovém vidění je úkol najít daný objekt v obraze nebo videosekvenci. Lidé rozeznají množství objektů v obrazech s malou námahou, a to navzdory skutečnosti, že obraz objektů se může poněkud lišit v různých úhlech pohledu, v mnoha různých velikostech / měřítku nebo dokonce i při jejich překladu nebo otočení. Objekty lze dokonce rozeznat, když jsou částečně zakryty z pohledu. Tento úkol je stále výzvou pro počítačové systémy vidění obecně.
Přístupy založené na CAD-like objektových modelech
Detekce hran, prvotní skica, Marr, Mohan and Nevatia, Lowe, Faugeras
Binford (generalizované válce), Biederman (geony), Dickinson, Forsyth a Ponce
Histogramy: Swain a Ballard, Schiele a Crowley, Schneiderman a Kanade, Linde a Lindeberg,
Koenderink a van Doorn, Dalal a Triggs
Přístupy založené na úrokových bodech
Scale-invariant feature transform
David Lowe byl průkopníkem přístupu počítačového vidění k extrakci a použití škálově invariantních SIFT funkcí z obrázků k provedení spolehlivého rozpoznání objektů.
Pytel slov reprezentace
Okenní detekce, 3D nápovědy, kontext, využití internetových dat, nekontrolované učení, rychlá indexace
Metody rozpoznávání objektů mají následující aplikace:
Daniilides a Eklundh, Edelman