Posilování

Při operantním podmiňování dochází k zesílení, když událost následující po odezvě způsobí zvýšení pravděpodobnosti, že tato odezva nastane v budoucnosti. Síla odezvy může být hodnocena pomocí takových měřítek, jako je frekvence, s jakou je odezva prováděna (například holub může klovat klíč vícekrát během sezení), nebo rychlost, s jakou je prováděna (například krysa může běžet bludištěm rychleji). Změna prostředí podmíněná odezvou se nazývá zesílení.

B.F. Skinner, výzkumník, který formuloval hlavní teoretické konstrukty výztuže a behaviorismu, odmítl specifikovat kauzální původ výztuží. Skinner tvrdil, že výztuže jsou definovány změnou síly odezvy (tedy funkčně spíše než kauzálně) a že to, co je výztuží pro jednu osobu, nemusí být výztuží pro druhou. Činnosti, potraviny nebo předměty, které jsou obecně považovány za příjemné nebo příjemné, tedy nemusí být nutně výztuží; mohou tak být považovány pouze v případě, že chování, které bezprostředně předchází potenciálnímu výztuži, vzroste v podobných budoucích situacích. Pokud dítě obdrží cookie, když o ni požádá, a zvýší se frekvence chování vyžadujícího „cookie“, může být cookie vnímána jako posilující chování vyžadující „cookie“. Pokud se však chování vyžadující „cookie“ nezvýší, nemůže být cookie považována za posilující. Jediným kritériem, které může určit, zda je položka, aktivita nebo jídlo posilující, je změna pravděpodobnosti chování po podání potenciálního posilujícího prostředku. Jiné teorie se mohou zaměřit na další faktory, například zda osoba očekávala, že strategie bude v určitém okamžiku fungovat, ale behaviorální teorie posilování by se zaměřila konkrétně na pravděpodobnost chování.

Studium výztuže přineslo obrovské množství reprodukovatelných experimentálních výsledků. Výztuže jsou ústředním konceptem a postupem v experimentální analýze chování a velkou částí kvantitativní analýzy chování.

Skinner pojednává o tom, že i když to tak může vypadat, trest není opakem posílení. Spíše má některé další účinky a snižuje nežádoucí chování.

Rozlišení „pozitivního“ od „negativního“ může být obtížné a nutnost tohoto rozlišení je často diskutována. Například ve velmi teplé místnosti slouží proud vnějšího vzduchu jako pozitivní posílení, protože je příjemně chladné nebo negativní posílení, protože odstraňuje nepříjemně horký vzduch. Některé posílení může být současně pozitivní i negativní, jako například drogově závislý, který užívá léky na zvýšenou euforii a odstraňuje abstinenční příznaky. Mnoho behaviorálních psychologů jednoduše odkazuje na posílení nebo potrestání – bez polarity – aby pokryli všechny následné změny životního prostředí.

Primární výztuha, někdy nazývaná nepodmíněná výztuha, je podnět, který nevyžaduje spárování, aby fungoval jako výztuha, a s největší pravděpodobností získal tuto funkci díky evoluci a své roli v přežití druhů. Příklady primárních výztuží zahrnují spánek, jídlo, vzduch, vodu a sex. Jiné primární výztuže, například určité léky, mohou napodobovat účinky jiných primárních výztuží. Zatímco tyto primární výztuže jsou poměrně stabilní během života a napříč jednotlivci, výztuha různých primárních výztuží se liší díky více faktorům (např. genetice, zkušenostem). Jeden člověk tak může dát přednost jednomu typu jídla, zatímco jiný si ho oškliví. Nebo jeden člověk může jíst hodně jídla, zatímco jiný jí velmi málo. Takže i když je jídlo primární výztuha pro oba jedince, hodnota jídla jako výztuže se mezi nimi liší.

Často primární výztuže dočasně přesouvají svou výztužnou hodnotu prostřednictvím sytosti a deprivace. Například potravina může přestat být účinná jako výztuže poté, co bylo její určité množství zkonzumováno (sytost). Po období, kdy nedostává žádnou z primárních výztuží (deprivace), však může primární výztuže opět získat svou účinnost při zvyšování pevnosti v odezvě.

Sekundární výztuha, někdy nazývaná podmíněná výztuha, je podnět nebo situace, která získala svou funkci výztuže po spárování se podnětem, který funguje jako výztuha. Tento podnět může být primární výztuha nebo jiná podmíněná výztuha (například peníze). Příkladem sekundární výztuže by mohl být zvuk cvakače, jak se používá při tréninku cvakače. Zvuk cvakače byl spojován s pochvalou nebo pohoštěním a následně může zvuk cvakače fungovat jako výztuha. Stejně jako u primárních výztuží může organismus zažívat nasycení a deprivaci sekundárními výztuhami.

Doporučujeme:  Amputace

Přírodní a umělé zpevnění

Jak je patrné z výše uvedeného, umělá výztuha je vytvořena pro budování nebo rozvíjení dovedností a pro zobecnění je důležité, aby buď byla zavedena past chování pro ‚zachycení‘ dovednosti a využití přirozeně se vyskytující výztuže k jejímu udržení nebo zvýšení. Tato past chování může být jednoduše sociální situace, která bude obecně vyplývat z konkrétního chování, jakmile splní určité kritérium (např.: pokud použijete jedlé výztuže k vycvičení člověka pozdravit a usmívat se na lidi, když se s nimi setká, poté, co byla tato dovednost vybudována, přírodní výztuha usmívajících se jiných lidí a mít více přátelské interakce přirozeně posílí dovednost a poživatiny mohou být vybledlé).

Harmonogramy posílení

Když je okolí zvířete kontrolováno, jeho vzorce chování po zesílení jsou předvídatelné, a to i pro velmi složité vzorce chování. Rozvrh zesílení je protokol pro určení, kdy budou zesíleny reakce nebo chování, od průběžného zesílení, při kterém je zesílena každá reakce, až po vyhynutí, při kterém není zesílena žádná reakce. Mezi těmito extrémy je přerušované nebo částečné zesílení, při kterém jsou zesíleny jen některé reakce.

Specifické variace přerušované výztuže spolehlivě vyvolávají specifické vzorce odezvy, bez ohledu na zkoumaný druh (včetně člověka v některých podmínkách). Řádnost a předvídatelnost chování podle rozvrhů výztuže byla důkazem pro tvrzení B. F. Skinnera, že pomocí operantního podmiňování může získat „kontrolu nad chováním“ způsobem, který činí teoretické spory současné srovnávací psychologie zastaralými. Spolehlivost rozvrhu kontroly podporovala myšlenku, že radikální behavioristická experimentální analýza chování by mohla být základem psychologie, která neodkazuje na mentální nebo kognitivní procesy. Spolehlivost rozvrhů také vedla k vývoji Aplikované behaviorální analýzy jako prostředku kontroly nebo změny chování.

Mnoho jednodušších možností a některé složitější byly Skinnerem velmi podrobně zkoumány za použití holubů, ale i nadále jsou definovány a zkoumány nové plány.

Graf znázorňující různou rychlost odezvy čtyř jednoduchých schémat výztuže, každá šrafovací značka označuje výztuž, která je dána

Jednoduché plány mají jediné pravidlo, které určuje, kdy je dodán jeden typ výztuže pro konkrétní odezvu.

Efekty různých typů jednoduchých rozvrhů

Složené rozvrhy kombinují dva nebo více různých jednoduchých rozvrhů nějakým způsobem za použití stejné výztuže pro stejné chování. Existuje mnoho možností; mezi nejčastěji používané patří:

Nadsazený rozvrh výztuže je termín v psychologii, který odkazuje na strukturu odměn, kdy dva nebo více jednoduchých rozvrhů výztuže působí současně. Výztuže mohou být pozitivní a/nebo negativní. Příkladem může být člověk, který přijde domů po dlouhém dni v práci. Chování při otevírání předních dveří je odměněno velkým polibkem na rty od partnera dotyčného a trhnutím kalhot od rodinného psa, který nadšeně skáče. Jiným příkladem nadsazených rozvrhů výztuže by byl holub v experimentální kleci, který klove do tlačítka. Výsledkem klování je, že násypka obilí je podávána při každém dvacátém klovnutí a přístup k vodě se stává dostupným po každých dvou stech klovnutích.

Nadřazené rozvrhy výztuže jsou typem složeného rozvrhu, který se vyvinul z počátečních prací na jednoduchých rozvrzích výztuže od B. F. Skinnera a jeho kolegů (Skinner a Ferster, 1957). Prokázali, že výztuže mohou být dodávány podle rozvrhů, a dále, že organismy se chovají odlišně podle různých rozvrhů. Spíše než výztuže, jako je jídlo nebo voda, dodávané pokaždé v důsledku nějakého chování, výztuže mohou být dodávány po více než jedné instanci chování. Například holub může být požádán, aby klovl tlačítko vypínače desetkrát před tím, než je dána potrava k dispozici holubovi. Tomu se říká „poměrový rozvrh“. Také výztuže mohou být dodávány po uplynutí časového intervalu, který následuje po cílovém chování. Příkladem je krysa, které je podávána potravní peleta dvě minuty poté, co krysa stiskla páčku. Tomu se říká „intervalový rozvrh“. Kromě toho mohou časové rozvrhy dodat výztuže po pevném nebo proměnlivém počtu chování jednotlivého organismu. Stejně tak mohou časové rozvrhy dodat výztuže po pevných nebo proměnlivých časových intervalech po jediné reakci organismu. Jednotlivé chování má tendenci generovat míru odezvy, která se liší podle toho, jak je časový rozvrh výztuže vytvořen. Mnoho následných výzkumů v mnoha laboratořích zkoumalo účinky na chování časových rozvrhů výztuží.
Pokud je organismu nabídnuta možnost vybrat si mezi dvěma nebo více jednoduchými časovými rozvrhy výztuže ve stejnou dobu, struktura výztuže se nazývá „souběžný časový rozvrh výztuže“. Brechner (1974, 1977) zavedl koncept „překrytých časových rozvrhů výztuže ve snaze vytvořit laboratorní analogii sociálních pastí, například když lidé překračují své loviště nebo strhávají své deštné pralesy. Brechner vytvořil situaci, kdy jednoduché časové rozvrhy posílení byly překryty jedna druhou. Jinými slovy, jediná reakce nebo skupina reakcí organismu vedla k mnohonásobným následkům. Souběžné časové rozvrhy posílení mohou být považovány za „nebo“ časové rozvrhy a překryté časové rozvrhy posílení mohou být považovány za „a“ časové rozvrhy. Brechner a Linder (1981) a Brechner (1987) rozšířili koncept tak, aby popsali, jak by překryté časové rozvrhy a analogie sociálních pastí mohly být použity k analýze způsobu, jakým energie proudí systémy.

Doporučujeme:  Procesní psychologie

Nahrazené rozvrhy posil mají kromě generování sociálních pastí také mnoho aplikací v reálném světě. Nahrazením jednoduchých rozvrhů posil lze vytvořit mnoho různých lidských individuálních a sociálních situací. Například lidská bytost může mít současně závislost na tabáku a alkoholu. Ještě složitější situace lze vytvořit nebo simulovat překrytím dvou nebo více souběžných rozvrhů. Například středoškolák by mohl mít na výběr mezi studiem na Stanfordově univerzitě nebo na UCLA a zároveň by měl na výběr mezi studiem v armádě nebo u letectva a současně by měl na výběr vzít práci u internetové společnosti nebo práci u softwarové společnosti. To by byla struktura posil tří překrytých souběžných rozvrhů posil. Nahrazené rozvrhy posil mohou být použity k vytvoření tří klasických konfliktních situací (konflikt přiblížení-přiblížení, konflikt přiblížení-vyhnutí a konflikt vyhnutí-vyhnutí) popsaných Kurtem Lewinem (1935) a mohou být použity k operacionalizaci dalších Lewinových situací analyzovaných jeho analýzou silového pole. Dalším příkladem použití překrytých rozvrhů posil jako analytického nástroje je jejich aplikace na eventuality regulace nájemného (Brechner, 2003).

V operantním podmiňování jsou souběžná schémata výztuže, která jsou současně dostupná zvířecímu subjektu nebo lidskému účastníkovi, takže subjekt nebo účastník může reagovat podle kteréhokoli schématu. Například holub ve Skinnerově boxu může být konfrontován se dvěma klovacími klíči; klovací odpovědi mohou být provedeny na kterémkoli z nich a potravinová výztuha může následovat po klování na kterémkoli z nich. Plány výztuže uspořádané pro klování na obou klíčích mohou být odlišné. Mohou být nezávislé, nebo mohou mít mezi sebou nějaké vazby, takže chování na jednom klíči ovlivňuje pravděpodobnost výztuže na druhém.

Není nutné, aby odpovědi na obou časových plánech byly fyzicky odlišné: alternativním způsobem uspořádání souběžných časových plánů, který zavedl Findley v roce 1958, jsou oba časové plány uspořádány na jednom klíči nebo jiném zařízení pro odezvu a subjekt nebo účastník může reagovat na druhém klíči, aby se mohl mezi časovými plány měnit. Při takovém postupu „Findleyho souběžnosti“ se používá podnět (např. barva hlavního klíče), který signalizuje, který časový plán je právě platný.

Souběžné plány často vyvolávají rychlé střídání mezi klávesami. Aby se tomu předešlo, běžně se zavádí „prodleva přechodu“: každý plán je deaktivován na krátkou dobu poté, co na něj subjekt přepne.

Když jsou obě souběžná schémata variabilními intervaly, najde se kvantitativní vztah známý jako zákon shody mezi relativními rychlostmi odezvy v obou schématech a relativními rychlostmi zesílení, které dodávají; to poprvé pozoroval R.J. Herrnstein v roce 1961.

Tvarování zahrnuje posilování po sobě jdoucích, stále přesnějších aproximací odezvy požadované cvičitelem. Při tréninku krysa stisknout páku, například, prosté otočení směrem k páce bude zpočátku posíleno. Potom, pouze otočení a krok směrem k ní bude posílen. Jak trénink postupuje, zesílená odezva se postupně více podobá požadovanému chování.

Doporučujeme:  Neurověda strachu

Řetěz zahrnuje propojení diskrétního chování v sérii, takže každý výsledek každého chování je jak posilou (nebo důsledkem) pro předchozí chování, tak i podnětem (nebo předchozím) pro další chování. Existuje mnoho způsobů, jak učit řetězení, jako je řetězení dopředu (počínaje prvním chováním v řetězci), řetězení dozadu (počínaje posledním chováním) a celkové řetězení úkolů (při kterém se celé chování učí od začátku do konce, spíše než jako série kroků). Příkladem by bylo otevření zamčených dveří. Nejprve se vloží klíč, pak se otočí, pak se otevřou dveře. Řetěz dopředu by naučil předmět nejprve vložit klíč. Jakmile je tento úkol zvládnut, je mu řečeno, aby vložil klíč, a je naučen s ním otáčet. Jakmile je tento úkol zvládnut, je mu řečeno, aby provedl první dva, pak je naučen otevřít dveře. Řetěz dozadu by znamenal, že učitel nejprve vloží a otočí klíčem, a předmět je naučen otevřít dveře. Jakmile je to naučeno, učitel vloží klíč, a předmět je naučen s ním otáčet, pak otevře dveře jako další krok. Nakonec je předmět naučen vložit klíč, a oni otočit a otevřít dveře. Jakmile je první krok zvládnut, celý úkol byl naučen. Celkové řetězení úkolů by zahrnovalo výuku celého úkolu jako jedné řady, pobízení přes všechny kroky. Výzvy jsou vybledlé (redukované) v každém kroku, jak jsou zvládnuty.

Standardní definice behaviorální výztuže byla kritizována jako kruhová, protože se zdá, že argumentuje tím, že síla odezvy je zvýšena výztuží a zároveň definuje výztuži jako něco, co zvyšuje sílu odezvy; to znamená, že standardní definice říká pouze to, že síla odezvy je zvýšena věcmi, které zvyšují sílu odezvy. Nicméně správné použití výztuže je to, že něco je výztuže kvůli svému účinku na chování, a ne naopak. To se stává kruhovou, pokud někdo říká, že určitý podnět posiluje chování, protože je výztuže, a neměl by být používán k vysvětlení, proč podnět produkuje tento účinek na chování.
Byly navrženy další definice, jako například F. D. Sheffieldovo „konzumní chování podmíněné odezvou“, ale ty nejsou široce používány v psychologii.

Ve dvacátých letech byl ruský fyziolog Ivan Pavlov možná první, kdo použil slovo „posílení“ s ohledem na chování, ale (podle Dinsmoora) používal jeho přibližný ruský koňak střídmě a už tehdy odkazoval na posílení již naučené, ale oslabující reakce. Nepoužíval ho, jako je tomu dnes, pro výběr a posílení nového chování. Pavlovovo zavedení slova „vyhynutí“ (v ruštině) se blíží dnešnímu psychologickému použití.

V lidovém použití se často používá pozitivní posílení jako synonymum pro odměnu, kdy lidé (ne chování) jsou tedy „posíleni“, ale to je v rozporu s konzistentním technickým užíváním tohoto termínu, protože se jedná o rozměr chování, a ne o osobu, která je posílena. Negativní posílení je často používáno laiky a dokonce sociálními vědci mimo psychologii jako synonymum pro trest. To je v rozporu s moderním technickým užíváním, ale byl to B. F. Skinner, kdo to poprvé použil tímto způsobem ve své knize z roku 1938. V roce 1953 však následoval ostatní a použil tak slovo trest a znovu použil negativní posílení pro odstranění averzních podnětů.

V oblasti analýzy chování existují někteří, kteří naznačili, že pojmy „pozitivní“ a „negativní“ představují zbytečný rozdíl v diskusích o posílení, protože často není jasné, zda jsou podněty odstraňovány nebo prezentovány. Například Iwata klade otázku: „…je změna teploty přesněji charakterizována prezentací chladu (tepla) nebo odebráním tepla (chladu)?“ (str. 363). Proto může být nejlepší pojmout posílení jednoduše jako stav před změnou, který je nahrazen stavem po změně, který posiluje chování, po kterém následovala změna stimulačních podmínek.

Další související pojmy