Při studiu zraku je vizuální krátkodobá paměť (VSTM) jedním ze tří širokých paměťových systémů, včetně ikonické paměti a dlouhodobé paměti. VSTM je typ krátkodobé paměti, která se však omezuje na informace ve vizuální oblasti.
Vizuoprostorový náčrtník je dílčí složkou VSTM v rámci teoretického modelu pracovní paměti, který navrhl Alan Baddeley. Termín VSTM však teoreticky neutrálně označuje nepermanentní ukládání vizuálních informací po delší časové období.
Zatímco ikonické vzpomínky jsou křehké, rychle se rozpadají a nelze je aktivně udržovat, vizuální krátkodobé vzpomínky jsou odolné vůči následným podnětům a trvají mnoho sekund.
Zavedení podnětů, které bylo obtížné verbalizovat a u nichž bylo nepravděpodobné, že by se udržely v dlouhodobé paměti, způsobilo na počátku 70. let revoluci ve studiu vizuální krátkodobé paměti (VSTM) (Cermak,
1971; Phillips, 1974; Phillips & Baddeley, 1971). Základní použitá experimentální technika vyžadovala, aby pozorovatelé označili, zda jsou dvě matice (Phillips, 1974; Phillips & Baddeley, 1971) nebo obrazce (Cermak, 1971), oddělené krátkým časovým intervalem, stejné. Zjištění, že pozorovatelé byli schopni hlásit, že došlo ke změně, a to na úrovni výrazně převyšující náhodu, naznačovalo, že byli schopni zakódovat určitý aspekt prvního podnětu v čistě vizuální paměti, přinejmenším po dobu do prezentace druhého podnětu. Protože však použité podněty byly komplexní a povaha změny relativně nekontrolovaná, ponechávaly tyto experimenty otevřené různé otázky, jako např: (1) zda je uložena pouze podmnožina vjemových dimenzí tvořících vizuální podnět (např. prostorová frekvence, jas nebo kontrast); (2) zda jsou některé vjemové dimenze uchovávány ve VSTM s větší věrností než jiné; a (3) povaha, kterou jsou tyto dimenze kódovány (tj. zda jsou vjemové dimenze kódovány v rámci samostatných, paralelních kanálů, nebo jsou všechny vjemové dimenze uloženy ve VSTM jako jeden vázaný celek?).
Psychofyzické přístupy k VSTM
V typickém psychofyzickém experimentu s VSTM je schopnost pozorovatele rozlišit…
mezi postupně prezentovanými testovacími a referenčními vzory se měří pomocí
dvouintervalového paradigmatu nucené volby (2-IFC). Například ve studii zahrnující
pozorovatel musí posoudit, zda se jedná o prostorovou frekvenci, nebo zda se jedná o prostorovou frekvenci, nebo zda se jedná o prostorovou frekvenci.
první nebo druhý předložený vzor má vyšší (nebo nižší) prostorovou frekvenci.
Obvykle jsou testovací a referenční vzory odděleny intervaly ISI v rozmezí 0 s až 0,5 s.
30 s. Vlastnosti dvojic podnětů lze kontrolovat pomocí psychofyzických testů.
schodišťového postupu nebo pomocí metody konstantních podnětů (podrobnosti o těchto
viz Regan, 2000). Při použití schodišťového postupu se vlastnosti
se mění, dokud se nedosáhne prahové úrovně výkonu.
(např. 75 % správně).
Věrnost paměťových reprezentací
Řada studií za poslední desetiletí a půl
(dobré přehledy viz Magnussen, 2000; Magnussen & Greenlee, 1999).
ukázaly, že VSTM ukládá různé percepční dimenze.
(např. prostorovou frekvenci, orientaci, odstín).
s pozoruhodnou mírou věrnosti a stability.
(Magnussen & Greenlee, 1992; Magnussen, Greenlee, Asplund & Dyrnes, 1991; Magnussen, Idas & Myhre, 1998; Regan, 1985).
Bylo prokázáno, že např,
že při referenční frekvenci 10 c/deg se prahové hodnoty prostorové frekvence testované s ISI až několik sekund (měřené jako Weberovy zlomky, Df/f) liší pouze o tři až šest procent od prahových hodnot zaznamenaných při současné prezentaci mřížek (Regan, 1985). Při rozdílu periody 360 úhlových vteřin znamená práh 0,04 Df/f, že pozorovatelé jsou schopni rozlišit rozdíly prostorových frekvencí o velikosti 14,4 úhlových vteřin (Magnussen & Greenlee, 1999). Jelikož je to přibližně polovina průměrného rozestupu čípků na fovee, znamená to, že pozorovatelé jsou schopni uchovávat informace o prostorové frekvenci v rozsahu hyperakustického rozlišení po dobu až 60 s (Bennett & Cortese, 1996).
Řada psychofyzických studií zjistila, že mnoho vjemových dimenzí.
(např. prostorová frekvence, odstín, orientace, rychlost) jsou uloženy s malou nebo žádnou ztrátou v čase.
VSTM. Jak již bylo zmíněno, prostorová frekvence může být uložena po dobu až 60 s.
bez zvýšení prahových hodnot (Bennett & Cortese, 1996; Magnussen & Greenlee,
1997; Magnussen et al., 1991; Magnussen, Greenlee & Thomas, 1996; Regan,
1985). Jiné studie ukázaly, že barva (Nilsson & Nelson, 1981), rychlost
(Magnussen & Greenlee, 1992) a orientace (Magnussen et al., 1998), jsou rovněž důležité.
uloženy ve VSTM po dobu až 10 s bez výrazného útlumu.
Jedinou významnou výjimkou z tohoto pravidla je kontrast. Několik studií ukázalo, že
že prahové hodnoty pro rozlišování kontrastu rychle rostou s rostoucím ISI, přičemž prahové hodnoty
se zdvojnásobí, když se ISI zvýší z 0 s na 10 s (Lee & Harris, 1996; Magnussen et al.,
1991; Magnussen et al., 1996). Zdá se, že je to způsobeno ztrátou informací o kontrastu s rostoucím ISI, která
odpovídajícím způsobem je stále méně pravděpodobné, že bude změna zaznamenána s rostoucím ISI
se zvyšuje. Úbytek informací o kontrastu je pravděpodobně základem zjevného úbytku
informací u experimentů VSTM využívajících maticové vzory (např. Phillips, 1974;
Phillips a Baddeley, 1971).
Struktura paměťových reprezentací
Paměťové maskování je experimentální technika, při níž se přidává do paměti určitý
„maskovací“ mřížka, umístěná mezi referenční a testovací podnět v experimentu.
psychofyzickém experimentu s VSTM (Bennett & Cortese, 1996; Magnussen &
Greenlee, 1992; Magnussen et al., 1991), vede ke zvýšení psychofyzického
prahů. Je však důležité poznamenat, že použití termínu „maskování“ zde není na místě.
je poněkud zavádějící, protože časové umístění dodatečné mřížky je takové, že se v něm
že nepůsobí ani jako vzorová maska, ani jako energetická maska pro testovací nebo energetickou masku.
referenčních podnětů (Breitmeyer, 1984).
Pokud se maskovací mřížka shoduje s testovací nebo referenční mřížkou ve vnímání
není pozorován žádný nárůst prahu ve srovnání se stavem bez maskování.
kontrolního stavu. Čím více se však maskující podnět liší od maskovacího podnětu.
referenční mřížkou v rozlišované dimenzi, prahové hodnoty se zvyšují.
až se prahy zvýší přibližně na dvojnásobek prahových hodnot zaznamenaných v případě nepřítomnosti diskriminace.
(Bennett & Cortese, 1996; Magnussen & Greenlee, 1992; Magnussen et.
al., 1991).
Krátká doba prezentace maskovacích podnětů (např. 200 ms) spolu s krátkou dobou prezentace maskovacích podnětů (např.
relativně dlouhými časovými intervaly mezi maskou a testovacím i referenčním podnětem.
podněty (např. Magnussen a kol., 1991), svědčí proti možnosti, že by prostorové
je vysvětlením pro zvýšení prahů způsobené přítomností prostorové adaptace.
(např. Blakemore & Campbell, 1969).
Dalším rysem paradigmatu maskování paměti je, že účinky masky jsou
specifické pro typ prováděné diskriminace. Například při provádění
orientace maskovací mřížky nemá žádný vliv na rozlišování prostorové frekvence.
na prahovou úroveň. Stejně tak nemá vliv prostorová frekvence maskovací mřížky.
nemění prahové hodnoty získané při rozlišování orientace (Magnussen et al.,
1991). Tato specifičnost maskovacího efektu na prahy svědčí proti jeho
že by byl zprostředkován buď rozptýlením pozorovatele, nebo přidáním dalšího
nespecifické zátěže paměti. Vzhledem k tomu, že orientace a prostorová frekvence jsou
ve zrakovém systému kódovány společně (DeValois a DeValois, 1990), je tento výsledek zřejmý.
podporuje názor, že neurofyziologické místo, které je ovlivněno maskováním paměti.
se vyskytuje po V1, v místě, kde se informace o orientaci a prostorové frekvenci setkávají.
kódovány do nezávislých percepčních kanálů. Tento argument je podpořen
zjištění, že maskování prostorovou frekvencí následuje spíše po percepční než po retinální analýze.
souřadnicemi (Bennett a Cortese, 1996), protože se předpokládá, že ke konstantnosti velikosti dochází také v oblasti
v hierarchii zrakového zpracování po V1 (Magnussen, 2000), možná v bodě
V4 (viz například Schiller, 1995).
Je dobře známo, že pozorovatelé jsou schopni nezávisle rozhodovat o
o více dimenzích podnětů (např. prostorová frekvence, kontrast, orientace) s malou pravděpodobností.
(např. Chua, 1990; Greenlee & Thomas, 1993; Vincent & Regan, 1995).
Tyto studie podporují názor, že prostorová frekvence, orientace a kontrast jsou
kódovány v rámci nezávislých, paralelních kanálů. Vzhledem k tomu, že jednotlivé neurony ve striatním
kůře společně kódují prostorovou frekvenci a orientaci (DeValois & DeValois,
1990, je pravděpodobné, že tyto kanály existují v pozdější fázi zrakového zpracování
než V1.
Shrnutí výsledků psychofyzických experimentů
Psychofyzikální experimenty s VSTM naznačují, že většina percepčních dimenzí
(např. prostorová frekvence, orientace, barva, rychlost) jsou ukládány s pozoruhodným
věrně po relativně dlouhou dobu (Magnussen, 2000). Jedinou výjimkou je
tohoto pravidla je kontrast, u něhož bylo prokázáno, že se ve VSTM rychle rozpadá (Lee & Harris, 1996). Konvergující důkazy, získané jak z experimentů využívajících maskování paměti.
(Magnussen & Greenlee, 1992), tak ze srovnání jednoduché a duální diskriminace.
(Magnussen & Greenlee, 1997), naznačují, že informace je
ve VSTM zakódovány ve formě více nezávislých kanálů, z nichž každý má podobu
představuje jinou percepční dimenzi. Další důkazy naznačují, že tento
jsou tyto informace zakódovány na pozdější úrovni zrakové hierarchie než V1 (např. Bennett
& Cortese, 1996).
Problémy s psychofyzickými vysvětleními
Greenleeho a Thomasův model (Greenlee & Thomas, 1993) má však jako model vlivu velikosti souboru ve VSTM dva nedostatky. Zaprvé byl empiricky testován pouze na zobrazeních složených z jednoho nebo dvou prvků. V různých experimentálních paradigmatech bylo opakovaně prokázáno, že se účinky velikosti sady liší u zobrazení složených z relativně malého počtu prvků (tj. přibližně ≤ 4 prvky) a u zobrazení spojených s větším počtem prvků (tj. přibližně > 4 prvky). Model Greenlee-Thomase (1993) nenabízí žádné vysvětlení, proč by tomu tak mohlo být. Za druhé, Magnussen, Greenlee a Thomas (1997) jsou sice schopni pomocí tohoto modelu předpovědět, že větší interference se projeví, když se dvojí rozhodování provádí v rámci téže percepční dimenze, a nikoliv napříč různými percepčními dimenzemi, ale tato předpověď postrádá kvantitativní přesnost a není schopna přesně předpovědět velikost zvýšení prahu ani podat podrobné vysvětlení jeho základních příčin.
Kromě Greenlee-Thomasova modelu (Greenlee & Thomas, 1993) existují i další modely.
dva další významné přístupy k popisu vlivu velikosti souboru ve VSTM. Tyto dva
přístupy lze označit jako modely velikosti vzorku (Palmer, 1990) a urnové modely (např. Pashler, 1988). Liší se
od modelu Greenlee-Thomase (1993) tím, že: (1) přisuzují hlavní příčinu velikosti souboru
(2) nerozlišují teoreticky příčinu účinků na soubor ve fázi předcházející rozhodování a
mezi rozhodnutími učiněnými ve stejných nebo různých percepčních dimenzích.
Modely kapacitních limitů ve VSTM
Pokud jsou pozorovatelé požádáni, aby podali zprávu o kvalitě (např. barvě) předmětu uloženého v paměti, může být výkon perfektní, pokud je zakódováno pouze několik předmětů (počet předmětů, které mohou být dokonale zakódovány, se liší v závislosti na zakódovaném atributu, ale obvykle je menší než pět), poté výkon vždy monotónně klesá, jak přibývají další předměty. Pro vysvětlení tohoto poklesu výkonnosti byly předloženy různé teoretické modely.
Významná třída modelů navrhuje, že pozorovatelé jsou omezeni celkovým počtem položek, které mohou být zakódovány, a to buď proto, že kapacita samotného VSTM je omezená (např. Cowan, 2001; Luck & Vogel, 1997; Pashler, 1988), nebo kvůli úzkému místu v počtu položek, které mohou být před zakódováním sledovány. Tento typ modelu má zjevnou podobnost s urnovými modely používanými v teorii pravděpodobnosti (viz např. Mendenhall, 1967). Model urny v podstatě předpokládá, že kapacita paměti VSTM je omezena pouze na několik položek, k (často se odhaduje, že se pohybuje v rozmezí tří až pěti položek). Pravděpodobnost, že nadprahová změna bude detekována, je jednoduše pravděpodobnost, že prvek změny je zakódován ve VSTM (tj. k/N). Ačkoli se k popisu výkonnostních omezení VSTM běžně používají urnové modely (např. Luck & Vogel, 1997; Pashler, 1988; Sperling, 1960), teprve nedávno byla zvážena skutečná struktura uložených položek. Luck a jeho kolegové uvedli sérii experimentů, jejichž cílem bylo objasnit strukturu informací uchovávaných ve VSTM (Luck & Vogel, 1997). Tato práce poskytuje důkaz, že položky uložené ve VSTM jsou souvislé objekty, a nikoliv elementárnější rysy, z nichž se tyto objekty skládají.
Mnohem kontroverznější rámec nedávno předložili Wilken a Ma (2004), kteří se domnívají, že zjevná kapacitní omezení VSTM jsou způsobena monotónním poklesem kvality uložených vnitřních reprezentací (tj. monotónním nárůstem šumu) v závislosti na velikosti souboru. V tomto pojetí nejsou kapacitní omezení paměti způsobena omezením počtu věcí, které lze zakódovat, ale poklesem kvality reprezentace každé věci s tím, jak se do paměti přidávají další věci.
Ve svých experimentech z roku 2004 měnili barvu, prostorovou frekvenci a orientaci objektů uložených ve VSTM pomocí přístupu založeného na teorii detekce signálu (SDT). Účastníci byli požádáni, aby hlásili rozdíly mezi vizuálními podněty, které jim byly předloženy v po sobě jdoucím pořadí. Invesigátoři zjistili, že různé podněty byly kódovány nezávisle a paralelně a že hlavním faktorem omezujícím diskriminační výkonnost byl neuronální šum (který je funkcí velikosti vizuálního souboru).
Modely velikosti vzorku (Palmer, 1990) navrhují, aby monotónní
s rostoucí velikostí souboru v experimentech s VSTM je přímým důsledkem poklesu výkonnosti.
je důsledkem omezení množství informací, které mohou pozorovatelé získat z vizuálního souboru.
zobrazení.
V modelu velikosti vzorku je každý vjemový atribut podnětu spojen s vnitřním, jednorozměrným vjemem, který je tvořen souborem konečného počtu diskrétních vzorků. Předpokládá se, že celkový počet vzorků, které lze shromáždit v celé vizuální scéně, je pevný. Za předpokladu, že každému podnětu je věnována stejná pozornost, z toho vyplývá, že celkový počet vzorků odebraných z každého prvku pole bude nepřímo úměrný počtu přítomných podnětů, N. Z centrální limitní věty vyplývá, že průměr odebraných vzorků, a tedy průměr vnitřního vjemu, bude mít rozptyl nepřímo úměrný N. Teorie detekce signálu definuje citlivost (tj, d′) jako nepřímo úměrnou směrodatné odchylce základní reprezentace, kterou je třeba rozlišit (Macmillan a Creelman, 1991). Proto podle modelu velikosti vzorku bude v experimentu VSTM citlivost pozorovatele na změnu podnětu, d′, nepřímo úměrná odmocnině z N.
Bohužel jen málo studií přímo testovalo tuto předpověď modelu velikosti vzorku. Určitý důkaz poskytl Palmer (1990), který provedl experiment VSTM s použitím polí složených z řádků různé délky a velikostí souboru jedna, dvě nebo čtyři. Úkolem pozorovatelů bylo určit, zda došlo ke změně délky jedné z čar. Bylo zjištěno, že prahové hodnoty pozorovatelů se zvyšují úměrně odmocnině z N, což je v souladu s předpovědí modelu velikosti vzorku.