Obrázek 1. Definice binokulární disparity (daleká a blízká).
Binokulární nepoměr se týká rozdílu v umístění obrazu objektu viděného levým a pravým okem, který vyplývá z horizontálního oddělení očí. Mozek používá binokulární nepoměr k získání informací o hloubce z dvourozměrných obrazů sítnice ve stereopsi. V počítačovém vidění se binokulární nepoměr týká stejného rozdílu viděného dvěma různými kamerami místo očí.
Lidské oči jsou horizontálně odděleny asi 50-75 mm (interpupilární vzdálenost) v závislosti na každém jedinci. Každé oko má tedy trochu jiný pohled na svět. To lze snadno vidět při střídavém zavírání jednoho oka při pohledu na svislou hranu.
Soustředění na objekt ve svém zorném poli znamená pohyb očí tak, že obraz objektu dopadá na fovea, místo ostrého vidění, v obou očích. Tomu se říká pohyb vergence. Po pohybu vergence se prý zaostřený objekt promítá do odpovídajících bodů na obou retinách. Vzhledem k rozdílným pohledům pozorovaným levým a pravým okem věci, které nejsou zaostřené (ležící před nebo za místem fixace), nepadají na odpovídající body sítnice.
Ve vizuálních neurovědách je binokulární nepoměr definován jako rozdíl mezi pozicemi odpovídajícího bodu a skutečným bodem projekce v jednom z očí a je obvykle vyjádřen ve stupních jako vizuální úhel.
Obr. 1: Plný černý kruh je bod fixace. Modrý objekt leží blíže k pozorovateli. Proto má „blízký“ nepoměr dn. Objekty ležící více daleko (zeleně) mají odpovídajícím způsobem „vzdálený“ nepoměr df. Binokulární nepoměr je úhel mezi dvěma liniemi projekce v jednom oku. Jednou z nich je skutečná projekce od objektu ke skutečnému bodu projekce. Druhou je imaginární projekce procházející ohniskovým bodem čočky jednoho oka k bodu odpovídajícímu skutečnému bodu projekce v druhém oku. Z důvodu jednoduchosti zde oba objekty leží na linii fixace pro jedno oko tak, že imaginární projekce končí přímo na fovea druhého oka, ale obecně fovea funguje nanejvýš jako reference. Všimněte si, že daleko nepoměry jsou menší než blízko nepoměrů u objektů, které mají stejnou vzdálenost od bodu fixace
V počítačovém stereo vidění neexistuje žádná mezipupilární vzdálenost. Místo toho existuje proměnná vzdálenost mezi oběma kamerami. Tato vzdálenost se nazývá základní linie. Rozdíl se zvyšuje s rostoucí základní linií, protože pohled na kamery se stále více liší.
Tricking neurony s 2D obrázky
Mozkové buňky (neurony) v části mozku zodpovědné za zpracování vizuální informace přicházející ze sítnice (primární zraková kůra) mohou zjistit existenci nepoměru v jejich vstupu z očí. Konkrétně tyto neurony budou aktivní, pokud objekt s „jejich“ zvláštní nepoměrem leží v části zrakového pole, ke které mají přístup (vnímavé pole).
Obrázek 2. Simulace nepoměru z hloubky v rovině. (vztahuje se k obr. 1)
Výzkumníci zkoumající přesné vlastnosti těchto neuronů s ohledem na nepoměr představují vizuální podněty s různými nepoměry k buňkám a sledují, zda jsou aktivní nebo ne. Jednou z možností prezentace podnětů s různými rozdíly je umístění předmětů v různé hloubce před oči, ale to má samozřejmě mnoho nevýhod a není to dostatečně přesné. Místo toho neurovědci používají trik, jak je znázorněn na obr. 2.
Obrázek 2: Obrázek ukazuje, že nepoměr objektu s odlišnou hloubkou, než je bod fixace, může být alternativně vyvolán prezentací obrazu objektu na jedno oko a laterálně posunutou verzí stejného obrazu na druhé oko. Plný černý kruh je bod fixace. Objekty v různé hloubce jsou umístěny podél linie fixace levého oka. Stejný nepoměr vytvořený posunutím hloubky objektu (vyplněné barevné kruhy) může být také vyvolán laterálním posunutím objektu v konstantní hloubce na obrázku, který vidí jedno oko (černé kruhy s barevným okrajem). Všimněte si, že pro blízké nepoměry musí být laterální posun větší, aby odpovídal stejné hloubce ve srovnání s dalekými nepoměry. To je to, co neurovědci obvykle dělají s náhodnými bodovými podněty, aby studovali selektivitu nepoměru neuronů, ale tento princip byl také aplikován v kouzelných očních iluzích.
Výpočet nepoměru pomocí digitálních stereo snímků
Výpočet odchylek se běžně provádí po procesu rektifikace obrazu. Tato konstrukce stereo snímků umožňuje nepoměr pouze v horizontálním směru (tj. není žádný nepoměr v souřadnicích snímku y). To je vlastnost, které lze dosáhnout také přesným zarovnáním stereo kamer (viz epipolární geometrie). Je důležité si uvědomit, že nepoměr se obvykle počítá jako posun vlevo od obrazového prvku při pohledu na pravý snímek. Například jeden bod, který se objeví na souřadnici x t (měřeno v pixelech) v levém snímku, může být přítomen na souřadnici x t – 3 v pravém snímku. V tomto případě by nepoměr na tomto místě v pravém snímku byl 3 pixely. Po rektifikaci lze pro výpočet nepoměrů na každém pixelu v pravém snímku použít jednoduchou výpočetní míru, jako je součet absolutních rozdílů (neboli SAD). Toho se dosáhne tak, že se vezme „záplata“ (často čtverec) pixelů na obrázku vlevo a najde se odpovídající záplata při každém platném nepoměru na obrázku vpravo. Například pro nepoměr 0 by byly oba záplaty na úplně stejném místě v obou obrázcích. Tedy pro nepoměr 1 by se záplata na obrázku vpravo pro nepoměr 0 jednoduše přesunula o 1 pixel vlevo. Absolutní rozdíl se pak vypočítá pro odpovídající pixely v každém záplatě (např. odpovídající pixel pro levý horní pixel v levém záplatě je prostě levý horní pixel v pravém záplatě). Tyto absolutní rozdíly se pak sečtou, aby se vypočítalo konečné SAD skóre. Po vypočtení tohoto SAD skóre pro všechny platné nepoměry (obvykle předurčené, např. 0-25) se za nepoměr, který přinesl nejnižší SAD skóre, určí nepoměr v daném místě na obrázku vpravo.
Výše popsaná metoda je algoritmus pro vyhledávání hrubou silou. Při velkých velikostech záplat a/nebo obrázků může být tato technika velmi pomalá. Protože však záplaty při disparitě d a disparitě d + 1 se významně překrývají, lze si zapamatovat velkou část práce z výpočtu předchozího skóre SAD. Techniky, které ukládají předchozí informace, mohou výrazně zvýšit algoritmickou efektivitu tohoto algoritmu.
Využití nepoměru v počítačovém vidění
Znalost nepoměru může být použita při dalším získávání informací ze stereo snímků. Rozdíl a vzdálenost od fotoaparátu jsou negativně korelovány. Jak se vzdálenost od fotoaparátu zvětšuje, nepoměr se zmenšuje. To umožňuje snímání hloubky ve stereo snímcích. Pomocí geometrie a algebry mohou být body, které se objevují ve 2D stereo snímcích, mapovány jako souřadnice ve 3D prostoru.