Konekcionismus je přístup v oblasti umělé inteligence, kognitivní vědy, neurovědy, psychologie a filozofie mysli. Konekcionismus modeluje mentální nebo behaviorální jevy jako emergentní procesy vzájemně propojených sítí jednoduchých jednotek. Vychází z předpokladu, že veškeré učení a chování odráží paradigma podnět-odpověď a právě tato spojení tvoří základ větších celků.
Existuje mnoho různých forem konekcionismu, ale nejběžnější formy využívají modely neuronových sítí.
Hlavní konekcionistický princip spočívá v tom, že mentální jevy lze popsat pomocí vzájemně propojených sítí jednoduchých jednotek. Podoba spojení a jednotek se může v jednotlivých modelech lišit. Jednotky v síti mohou například představovat neurony a spojení mohou představovat synapse. V jiném modelu by každá jednotka v síti mohla představovat slovo a každé spojení označení sémantické podobnosti.
Většina konekcionistických modelů zahrnuje čas, tj. síť se v průběhu času mění. Úzce souvisejícím a velmi častým aspektem konekcionistických modelů je aktivace. V každém okamžiku má jednotka v síti aktivaci, což je číselná hodnota, která má reprezentovat nějaký aspekt jednotky. Například pokud jsou jednotkami v modelu neurony, aktivace může představovat pravděpodobnost, že neuron vygeneruje spik akčního potenciálu. Pokud je model modelem šířící se aktivace, pak se v průběhu času aktivace jednotky šíří na všechny ostatní jednotky, které jsou k ní připojeny. Šířící se aktivace je vždy vlastností modelů neuronových sítí a je velmi častá v konekcionistických modelech používaných kognitivními psychology.
Hlavní článek: Neuronové sítě
Neuronové sítě jsou dnes zdaleka dominantní formou konekcionistického modelu. Mnoho výzkumů využívajících neuronové sítě se provádí pod obecnějším názvem „konekcionistické“. Tyto konekcionistické modely se drží dvou hlavních zásad týkajících se mysli:
Přestože existuje velké množství modelů neuronových sítí, jen velmi zřídka se odchylují od těchto dvou základních principů. Většina rozmanitosti pochází z:
Konekcionisté se shodují na tom, že rekurentní neuronové sítě (sítě, jejichž spoje mohou tvořit směrovaný cyklus) jsou lepším modelem mozku než dopředné neuronové sítě (sítě bez směrovaných cyklů). Mnoho rekurentních konekcionistických modelů zahrnuje také teorii dynamických systémů. Mnozí výzkumníci, například konekcionista Paul Smolensky, tvrdí, že směr, kterým se budou konekcionistické modely ubírat, je směrem k plně spojitým, vysokodimenzionálním, nelineárním přístupům dynamických systémů.
Konekcionisté ve svých modelech obecně zdůrazňují význam učení. V důsledku toho konekcionisté vyvinuli mnoho sofistikovaných postupů učení pro neuronové sítě. Učení vždy zahrnuje úpravu vah spojení. Ty obvykle zahrnují matematické vzorce pro určení změny vah při zadání souborů dat sestávajících z aktivačních vektorů pro určitou podmnožinu neuronových jednotek.
Tím, že konekcionisté takto formalizují učení, mají k dispozici mnoho nástrojů. Velmi častou taktikou konekcionistických metod učení je začlenění gradientního sestupu nad chybovou plochou v prostoru definovaném váhovou maticí. Veškeré učení gradientním sestupem v konekcionistických modelech zahrnuje změnu každé váhy pomocí parciální derivace chybové plochy vzhledem k dané váze. Zpětné šíření, které se poprvé stalo populárním v 80. letech 20. století, je dnes pravděpodobně nejznámějším konekcionistickým algoritmem gradientního sestupu.
Konekcionismus má své kořeny v myšlenkách starých více než sto let. Konekcionistické myšlenky však byly až do poloviny a konce 20. století pouhou spekulací. Teprve v 80. letech 20. století se konekcionismus stal mezi vědci populárním názorem.
Paralelní distribuované zpracování
Složité programy pro paralelní distribuované zpracování, jako je zde uvedený program PDP++, mohou vést k výkonným simulacím.
Dnes převládající konekcionistický přístup byl původně známý jako Parallel Distributed Processing (PDP). PDP byl přístup založený na neuronových sítích, který zdůrazňoval paralelní povahu neuronového zpracování a distribuovanou povahu neuronových reprezentací.
PDP poskytl výzkumníkům obecný matematický rámec, ve kterém se mohou pohybovat. Tento rámec zahrnoval osm hlavních aspektů:
Těchto osm aspektů je dnes základem téměř všech konekcionistických modelů.
Mnoho výzkumů, které vedly k vývoji PDP, bylo provedeno v 70. letech, ale PDP se stalo populárním v 80. letech s vydáním Parallel Distributed Processing: McClellanda, Davida E. Rumelharta a výzkumné skupiny PDP. Ačkoli jsou tyto knihy dnes považovány za stěžejní konekcionistické práce, termín „konekcionismus“ autoři v té době pro popis svého rámce nepoužívali. V současnosti je však běžné PDP a konekcionismus plně ztotožňovat.
Přímými kořeny PDP byly teorie perceptronu badatelů, jako byl Frank Rosenblatt, z 50. a 60. let 20. století. Perceptronové modely se však staly velmi nepopulárními po vydání knihy Perceptrony od Marvina Minského a Seymoura Paperta v roce 1969. Minsky a Papert elegantně ukázali omezení druhů funkcí, které mohou perceptrony počítat, a ukázali, že ani jednoduché funkce, jako je exkluzivní disjunkce, nelze správně zpracovat. Knihy o PDP toto dřívější omezení překonaly tím, že ukázaly, že víceúrovňové nelineární neuronové sítě jsou mnohem robustnější a lze je použít pro širokou škálu funkcí.
Nicméně již před 80. lety 20. století existovalo mnoho výzkumníků mimo teoretiky perceptronů, kteří prosazovali konekcionistický styl modelů.
Ve 40. a 50. letech 20. století zastávali konekcionistické teorie vědci jako Warren McCulloch, Walter Pitts, Donald Hebb a Karl Lashley. McCullough a Pitts ukázali, jak lze logiku prvního řádu implementovat pomocí neuronových systémů: jejich klasický článek „A Logical Calculus of Ideas Immanent in Nervous Activity“ (1943) je zde pro tento vývoj důležitý (byli ovlivněni významnou prací Nicolase Rashevského z 30. let). Hebb významně přispěl ke spekulacím o fungování nervové soustavy, a dokonce navrhl dodnes používaný princip učení, známý jako Hebbovo učení. Lashley argumentoval pro distribuované reprezentace v důsledku toho, že se mu během let experimentů s lézemi nepodařilo najít nic podobného lokalizovanému engramu.
Konekcionismus kromě PDP
Ačkoli je PDP dominantní formou konekcionismu, práce dalších teoretiků by měly být klasifikovány jako konekcionistické.
Mnohé konekcionistické principy lze vysledovat až k raným pracím v psychologii, například k dílu Williama Jamese, i když je třeba zdůraznit, že psychologické teorie založené na tehdejších poznatcích o lidském mozku byly na konci 19. století poměrně módní. Již v roce 1869 neurolog John Hughlings Jackson obhajoval víceúrovňové, distribuované systémy. V návaznosti na něj byly v knize Herberta Spencera Principles of Psychology, 3. vydání (1872), a Sigmunda Freuda Project for a Scientific Psychology (sestavené v roce 1895) předloženy konekcionistické nebo proto-konekcionistické teorie. Jednalo se však spíše o spekulativní teorie. Na počátku 20. století však Edward Thorndike prováděl experimenty s učením, které předpokládaly konekcionistický typ sítě.
V 50. letech 20. století vyslovil badatel Friedrich Hayek myšlenku spontánního řádu v mozku, který vzniká z decentralizovaných sítí jednoduchých jednotek, ale Hayekova práce nebyla donedávna v literatuře o PDP obecně citována.
Další formou konekcionistického modelu byl rámec relačních sítí, který v 60. letech 20. století vyvinul lingvista Sydney Lamb. Relační sítě byly vždy používány pouze lingvisty a nikdy nebyly sjednoceny s přístupem PDP. V důsledku toho dnes relační sítě používá jen velmi málo výzkumníků.
Debata o konekcionismu vs. komputacionalismu
Když se konekcionismus koncem 80. let stal stále populárnějším, objevila se reakce některých badatelů proti konekcionismu, včetně Jerryho Fodora, Stevena Pinkera a mnoha dalších. Tito teoretici tvrdili, že konekcionismus, jak byl v té době rozvíjen, je v nebezpečí, že zmaří pokrok, kterého v oblasti kognitivní vědy a psychologie dosáhl klasický přístup komputacionalismu. Komputacionalismus je specifická forma kognitivismu, která tvrdí, že mentální činnost je výpočetní, tj. že mysl je v podstatě Turingův stroj. Mnozí badatelé tvrdili, že trend konekcionismu směřuje k návratu k asociacionismu a k opuštění myšlenky jazyka myšlení, což považovali za chybné. Na druhou stranu právě tyto tendence činily konekcionismus pro jiné badatele přitažlivým.
Konekcionismus a komputacionalismus nemusejí být samy o sobě v rozporu, ale debata, jak byla formulována na přelomu 80. a 90. let 20. století, jistě vedla k opozici mezi těmito dvěma přístupy. Po celou dobu debaty však někteří badatelé tvrdili, že konekcionismus a komputacionalismus jsou plně kompatibilní, ačkoli nikdy nebylo dosaženo ničeho podobného konsenzu. Rozdíly mezi oběma přístupy, které se obvykle uvádějí, jsou následující:
I když tyto rozdíly existují, nemusí být nutné. Například je dobře známo, že konekcionistické modely mohou skutečně implementovat systémy manipulace se symboly, jaké se používají v komputacionalistických modelech. Rozdíly tedy mohou být záležitostí osobních rozhodnutí, která někteří konekcionističtí výzkumníci činí, na rozdíl od něčeho zásadního pro konekcionismus.
Aby to bylo ještě komplikovanější, v poslední době se ve filozofii mysli rozšířily dynamické systémy (díky pracím autorů, jako je Tim Van Gelder), které do debaty vnesly nový pohled. Někteří autoři nyní tvrdí, že jakýkoli rozkol mezi konekcionismem a komputacionalismem je ve skutečnosti jen rozkolem mezi komputacionalismem a dynamickými systémy, což naznačuje, že původní debata byla zcela mylná.
Všechny tyto protichůdné názory vedly mezi vědci k rozsáhlým diskusím na toto téma a je pravděpodobné, že debaty budou pokračovat.
Johnson, M (1993) (Ed.), Brain Development and Cognition: A Reader. Oxford: Blackwell Publishers.
Bates, E A & Elman, JL (1993) Connectionism and the Study of Change. In Johnson, M (Ed.), Brain Development and Cognition: A Reader. Oxford: Blackwell Publishers. Pp. 623-642.Celý text