TRACE je Connectionistický model vnímání řeči, navržený Jamesem McClellandem a Jeffreym Elmanem v roce 1986. TRACE byl vytvořen do funkčního počítačového programu pro provádění percepčních simulací. Tyto simulace jsou předpovědí toho, jak lidská mysl/mozek zpracovává zvuky řeči a slova tak, jak jsou slyšeny v reálném čase.
TRACE vznikla během formativního období konektionismu a byla zařazena jako kapitola do knihy „Paralelní distribuované zpracování: průzkumy v mikrostrukturách poznávání“. Výzkumníci zjistili, že některé problémy týkající se vnímání řeči lze pojmout ve smyslu interaktivního aktivačního modelu konektionisty. Problémy spočívaly v tom, že 1) řeč je prodloužena v čase, 2) zvuky řeči (fonémy) se překrývají navzájem, 3) artikulace zvuku řeči je ovlivněna zvuky, které přicházejí před ní a po ní, a 4) existuje přirozená variabilita řeči (např. cizí přízvuk) a také hluk v prostředí (např. rušná restaurace). Každá z těchto situací způsobuje, že signál řeči je složitý a často nejednoznačný, takže je pro lidskou mysl/mozek obtížné rozhodnout, jaká slova skutečně slyší. Velmi zjednodušeně řečeno, interaktivní aktivační model řeší tento problém tím, že umístí různé druhy zpracovatelských jednotek (fonémy, slova) do izolovaných vrstev, umožní aktivovaným jednotkám předávat informace mezi vrstvami, a jednotky ve vrstvách mezi sebou soupeří, dokud „vítěz“ není modelem považován za „rozpoznaného“.
Simulace vnímání řeči zahrnuje prezentaci počítačového programu TRACE s předstíraným vstupem řeči, spuštění programu a generování výsledku. Úspěšná simulace ukazuje, že výsledek je smysluplně podobný tomu, jak lidé zpracovávají řeč.
Abychom použili analogii, model akciového trhu je teorie o tom, jak trh funguje. Pokud je z modelu udělán počítačový program a program generuje jednoletou předpověď výkonnosti trhu, pak je to ověřitelná předpověď. Pokud se ukáže, že předpověď je zcela přesná, pak model musí být užitečnou teorií o akciovém trhu. TRACE je stejný druh teorie, jen se zajímá o to, jak lidé vnímají řeč.
Časový průběh rozpoznávání slov
V psycholingvistice je široce přijímáno, že (1) když je slyšet začátek slova, aktivuje se v paměti soubor slov, která mají stejný počáteční zvuk, (2) slova, která jsou aktivována, spolu soupeří, zatímco je slyšet stále více slova, (3) v určitém okamžiku je díky sluchovému vstupu i lexikální soutěži rozpoznáno jedno slovo.
Například posluchač slyší počátek plešatosti“ a slova plešatý, koule, špatný, účet se v paměti aktivují. Pak, brzy poté, v soutěži zůstávají jen plešatý a koule (špatný, účet byl vyřazen, protože zvuk samohlásky neodpovídá vstupu). Brzy poté je plešatost rozpoznána. TRACE simuluje tento proces reprezentací časové dimenze řeči, umožňuje slovům ve slovníku měnit sílu aktivace a tím, že slova soutěží během zpracování. Obrázek 1 ukazuje čárový graf aktivace slova v jednoduché simulaci TRACE.
Obrázek 1 – Jednoduchá simulace TRACE. Aktivace slov a soutěž se odvíjí v čase. V této simulaci se slovo „plešatý“ stává nejaktivnějším, proto je považováno za to, které je rozpoznáno.
Lexikální efekt na fonémové vnímání
Je-li vysloven nejednoznačný řečový zvuk, který je přesně mezi /t/ a /d/, může mít posluchač problém určit, o co se jedná. Je-li však tentýž nejednoznačný zvuk slyšet na konci slova jako woo? (kde ? je nejednoznačný zvuk), pak posluchač bude spíše vnímat zvuk jako /d/. K tomu pravděpodobně dochází proto, že dřevo je slovo, ale woot není. Nejednoznačný foném prezentovaný v lexikálním kontextu bude vnímán v souladu s okolním lexikálním kontextem. Tento percepční efekt je znám jako Ganongův efekt. TRACE to spolehlivě simuluje a může to vysvětlit relativně jednoduchými termíny. Lexikální jednotka, která se aktivuje vstupem (tj. dřevem), v podstatě zpětně aktivuje vrstvu fonému, čímž zvyšuje aktivaci jeho základních fonémů (tj. /d/), čímž se nejednoznačnost vyřeší.
Lexikální základ segmentace
Řečníci nenechávají pauzy mezi slovy při mluvení věty, přesto se zdá, že lidé nemají problém slyšet věty jako sled slov. To je známé jako problém segmentace a je to jeden z nejstarších problémů v psychologii jazyka. TRACE navrhl následující řešení, podpořené simulacemi. Když se slova aktivují a rozpoznají, odhalí se tím umístění slovních hranic. Silnější aktivace slov vede k větší důvěře ohledně slovních hranic, což informuje posluchače o tom, kde má další slovo začít.
Model TRACE je Connectionist síť se vstupní vrstvou a třemi vrstvami zpracování: pseudo-spektera (vlastnost), foném a slovo. Na obrázku 2 je schematický diagram TRACE. Existují tři typy připojení: (1) feedforward excitatory connections from input to features, features to phonemes, and phonemes to words; (2) lateral (tj. within layer) inhibitory connections at the feature, phoneme and word layers; and (3) top-down feedback excitatory connections from words to phonemes.
Vstup do TRACE funguje následovně. Uživatel poskytuje fonémovou sekvenci, která je převedena na vícerozměrný vektor vlastností. Jedná se o aproximaci akustického spektra rozšířeného v čase.
Vstupní vektor je odkrýván po troškách, aby byla simulována časová povaha řeči. Jak je prezentován každý nový kus vstupu, vysílá to aktivitu podél síťových spojení, čímž se mění hodnoty aktivace ve vrstvách zpracování. Funkce aktivují fonémové jednotky a fonémy aktivují slovní jednotky. Parametry řídí sílu excitačních a inhibičních spojení a také mnoho dalších detailů zpracování.
Neexistuje žádný specifický mechanismus, který by určoval, kdy bylo slovo nebo foném rozpoznáno. Pokud jsou simulace porovnávány s daty reakční doby z percepčního experimentu (např. lexikální rozhodnutí), pak se typicky používá aktivační práh. To umožňuje interpretovat chování modelu jako rozpoznání a zaznamenat dobu rozpoznání jako počet zpracovatelských cyklů, které uplynuly. Pro hlubší pochopení dynamiky zpracování TRACE odkazujeme čtenáře na původní publikaci a na softwarový nástroj TRACE, který spouští simulace s grafickým uživatelským rozhraním.
Obrázek 2 – Schematický diagram architektury TRACE.
Význam TRACE pro debatu o modularitě nedávno vynesla do popředí Norrisova, Cutlerova a McQueenova (2001) zpráva o modelu slučování vnímání řeči. I když má s TRACE řadu společných rysů, klíčový rozdíl je následující. Zatímco TRACE umožňuje slovním jednotkám zpětnou aktivaci na úroveň fonémů, Merge omezuje její zpracování na přípojky pro přenos. V podmínkách této debaty se má za to, že TRACE porušuje princip zapouzdření informací, který je pro modularitu stěžejní, když umožňuje pozdější fázi zpracování (slova) posílat informace do dřívější fáze (fonémy). Merge obhajuje modularitu argumentem, že stejná třída percepčních jevů, která je započítána v TRACE, může být vysvětlena v Connectionistické architektuře, která nezahrnuje připojení zpětné vazby. Norris a kol. poukazují na to, že když dvě teorie mohou vysvětlit stejný jev, parsimonie velí, že je vhodnější jednodušší teorie.
Řeč a jazyková terapie
Modely zpracování jazyka mohou být použity ke konceptualizaci povahy poruchy u osob s poruchou řeči a jazyka. Například bylo naznačeno, že jazykové deficity v Brocově afázii mohou být způsobeny nadměrnou soutěží mezi lexikálními jednotkami, což brání tomu, aby se jakékoli slovo dostatečně aktivovalo. Argumenty pro tuto hypotézu uvažují, že mentální dysfunkce mohou být vysvětleny mírným narušením zpracování síťového modelu. Tato vznikající linie výzkumu zahrnuje širokou škálu teorií a modelů a TRACE představuje pouze jeden dílek rostoucí skládanky.
Rozlišení od softwaru pro rozpoznávání řeči
Psycholingvistické modely vnímání řeči, např. TRACE, je třeba odlišit od počítačových nástrojů pro rozpoznávání řeči. První z nich jsou psychologické teorie o tom, jak lidská mysl/mozek zpracovává informace. Druhé jsou navržená řešení pro převod akustického signálu na text. Historicky měly tyto dvě oblasti jen malý kontakt, ale to se začíná měnit.
Vliv TRACE v psychologické literatuře lze posoudit podle počtu článků, které ji citují. V databázi PsycINFO je 345 citací McClellanda a Elmana (1986). Obrázek 3 ukazuje rozložení těchto citací v letech od zveřejnění. Číslo naznačuje, že zájem o TRACE v roce 2001 výrazně vzrostl a zůstal silný, s přibližně 30 citacemi ročně.
Obrázek 3 – Roční rozpis citací TRACE ve výzkumné databázi PsycINFO.