Tit for tat

Tit for tat je vysoce účinná strategie v teorii her pro iterované vězňovo dilema. Poprvé ji představil Anatol Rapoport ve dvou turnajích Roberta Axelroda, které se konaly kolem roku 1980. Na základě anglického rčení, které znamená „ekvivalentní odplatu“ („tit for tat“), bude agent používající tuto strategii zpočátku spolupracovat, poté odpoví v naturáliích na předchozí akci protivníka. Pokud byl protivník dříve kooperativní, agent je kooperativní. Pokud ne, agent není. To je ekvivalentní konceptu recipročního altruismu v kontextu biologie.

Tato strategie je závislá na čtyřech podmínkách, které jí umožnily stát se nejrozšířenější strategií pro Vězňovo dilema:

V poslední podmínce závisí definice „dobré šance“ na výplatní matici vězňova dilematu. Důležité je, aby soutěž pokračovala dostatečně dlouho na to, aby opakované tresty a odpuštění generovaly dlouhodobě vyšší výplatu, než je možná ztráta z prvotní spolupráce.

Aby měla soutěž smysl, platí pátá podmínka: pokud agent ví, že příští hra bude poslední, měl by přirozeně zběhnout kvůli vyššímu skóre. Podobně pokud ví, že další dvě hry budou poslední, měl by zběhnout dvakrát a tak dále. Proto nesmí být agentům předem znám počet soutěží.

Proti nejrůznějším alternativním strategiím bylo nejlepší oko za oko, vyhrálo se v několika ročních automatizovaných turnajích proti (obecně mnohem složitějším) strategiím vytvořeným týmy počítačových vědců, ekonomů a psychologů. Teoretici her neformálně věřili, že strategie je optimální (i když nebyl předložen žádný důkaz).

Je důležité vědět, že oko za oko je stále nejúčinnější strategií, pokud porovnáte průměrný výkon každého soutěžícího týmu. Tým, který nedávno vyhrál nad čistým oko za oko za oko, ho překonal jen s některými svými algoritmy, protože předložil více algoritmů, které by se navzájem poznaly a předpokládaly vztah pána a otroka (jeden algoritmus by se „obětoval“ a získal by velmi špatný výsledek, aby druhý algoritmus byl schopen předčit Tit za Tata na individuálním základě, ale ne jako pár nebo skupina). Přesto toto vítězství „skupiny“ ilustruje důležité omezení Věznicova dilematu v reprezentaci sociální reality, totiž že nezahrnuje žádný přirozený ekvivalent přátelství nebo spojenectví. Výhoda „oko za oko“ se tak týká pouze hobbesovského světa racionálních řešení, nikoli světa, v němž jsou lidé ze své podstaty sociální.

Doporučujeme:  Efedrin

Předpokládejme, že existují 4 agenti: 2 jsou Tit pro Tat hráče („proměnné“) a 2 jsou „přeběhlíci“, jednoduše se snaží maximalizovat svou vlastní výhru tím, že vždy podávají svědectví proti druhému. Předpokládejme, že každý hráč stojí proti ostatním 3 v zápase trvajícím 6 her. Pokud jeden hráč podá svědectví proti hráči, který tak neučiní, získá první hráč 5 bodů a druhý 0. Pokud se oba zdrží podávání svědectví, získají oba 3 body. Pokud oba podávají svědectví proti sobě, získají oba 1 bod.

Konečné skóre pro každou proměnnou je 5 (hra proti přeběhlíkovi(1)) + 5 (hra proti přeběhlíkovi(2)) + 18 (hra proti proměnné) = 28 bodů.
Konečné skóre pro každého přeběhlíka je 10 (proti proměnné(1)) + 10 (proti proměnné(2)) + 6 (proti přeběhlíkovi) = 26 bodů.

Navzdory tomu, že proměnné nikdy nevyhrály zápas a přeběhlíci nikdy neprohráli zápas, proměnné se přesto dostaly dopředu, protože konečné skóre neurčuje vítěz zápasů, ale bodový střelec. Jednoduše řečeno, proměnné získaly více bodů, když se vázaly mezi sebou, než když prohrály s přeběhlíky.
Čím více proměnných ve hře je, tím větší výhodou je být proměnnou.

(Tento příklad byl převzat z románu Pierse Anthonyho Golem v soukolí.)

Úspěch strategie, která je z velké části kooperativní, mnohé překvapil. V po sobě jdoucích soutěžích různé týmy vytvořily komplexní strategie, které se pokoušely „podvádět“ různými mazanými způsoby, ale Tit for Tat nakonec zvítězil v každé soutěži.

Někteří teoretici se domnívají, že tento výsledek může poskytnout vhled do toho, jak skupiny zvířat (a zejména lidských společností) začaly žít v převážně (nebo zcela) kooperativních společnostech, spíše než do individualistického způsobu „červená v zubech a drápech“, který by se dal očekávat od jedince zapojeného do hobbesovského stavu přírody. Toto, a zejména jeho uplatnění v lidské společnosti a politice, je předmětem knihy Roberta Axelroda Evoluce spolupráce. Také teorie může poskytnout vhled do toho, jak v historii docházelo k technologickým inovacím, a zejména do toho, proč se moderní doba vyvíjela v mnoha soupeřících královstvích Evropy, ale ne například v Číně. To je dále rozebráno v knize Roberta Wrighta Nonzero: The Logic of Human Destiny.

Doporučujeme:  Antivěda

I když bylo empiricky prokázáno (Axelrodem), že strategie je v některých případech optimální, dva agenti hrající oko za oko zůstávají zranitelní. Jednorázová, jednobitová chyba v interpretaci událostí kteréhokoli hráče může vést k nekončící „spirále smrti“. V této symetrické situaci každá strana vnímá sama sebe jako preferující spolupráci, jen kdyby druhá strana chtěla. Ale každá je strategií donucena k opakovanému potrestání protivníka, který pokračuje v útoku navzdory tomu, že je potrestán v každém herním cyklu. Obě strany se začnou považovat za nevinné a jednající v sebeobraně a jejich protivník za buď zlý nebo příliš hloupý, aby se naučil spolupracovat.

Tato situace často nastává v reálných konfliktech, počínaje školáckými rvačkami a konče občanskými a regionálními válkami. K vyhnutí se tomuto problému by se dala použít koza za dvě tetování.

„Tit for Tat with forgiveness“ je někdy lepší. Když soupeř přeběhne, při dalším tahu hráč někdy stejně spolupracuje, s malou pravděpodobností (kolem 1%-5%). To umožňuje občasné zotavení z uvíznutí v cyklu přeběhnutí. Přesná pravděpodobnost závisí na sestavě soupeřů. „Tit for Tat with forgiveness“ je nejlepší, když je do hry zavedena špatná komunikace – když je soupeři nesprávně nahlášen jeho tah.

Tit for two tats is a strategy in game theory for the iterated prisoner’s dilema. The strategy is similar to tit for tat in that it is nice, retaliating, forgiving and non-envious, the only difference between the two being how nice the strategy is.

Ve strategii „tit for tat“, jakmile protivník přeběhne, hráč „tit for tat“ okamžitě reaguje přeběhnutím při dalším tahu. To má neblahý následek, že dvě odvetné strategie neustále přebíhají proti sobě, což vede ke špatnému výsledku pro oba hráče. Hra „tit for two tats“ nechá první přeběhnutí bez povšimnutí jako prostředek, jak se vyhnout „smrtící spirále“ předchozího příkladu. Pokud protivník přeběhne dvakrát za sebou, hráč „tit for two tats“ odpoví přeběhnutím.

Doporučujeme:  Pohyby očí

Tuto strategii předložil Robert Axelrod během svého druhého kola počítačových simulací v RAND. Po analýze výsledků prvního experimentu zjistil, že kdyby účastník zadal strategii cecek pro dvě tetování, vyšlo by mu to s vyšším kumulativním skóre než jakémukoliv jinému programu. Díky tomu do ní sám vstoupil s velkými očekáváními ve druhém turnaji. Bohužel kvůli agresivnější povaze programů přihlášených ve druhém kole, cecek pro dvě tetování dopadl výrazně hůře než cecek pro tetování kvůli agresivním strategiím, které byly schopny využít jeho vysoce shovívavé povahy.

Najít tuto stránku na Wiktionary:
tit for tat

Normal-form game · Extensive-form game · Cooperative game · Information set · Preference

Nashova rovnováha · Podherní dokonalost · Bayesovská-Nashova · Dokonalá Bayesovská · Třesoucí se ruka · Správná rovnováha · Epsilonová rovnováha · Korelovaná rovnováha · Sekvenční rovnováha · Kvazidokonalá rovnováha · Evolučně stabilní strategie · Riziková dominance · Paretova efektivita

Dominantní strategie · Pure strategy · Mixed strategy · Tit for tat · Grim trigger · Collusion · Backward induction

Symetrická hra · Perfektní informace · Dynamická hra · Sekvenční hra · Opakovaná hra · Signalizační hra · Levné povídání · Hra s nulovým součtem · Mechanismus design · Vyjednávací problém · Stochastická hra · Nontransitivní hra · Globální hry

Vězeňské dilema · Cestovatelské dilema · Koordinační hra · Kuře · Dobrovolnické dilema · Aukce dolarů · Bitva pohlaví · Lov jelenů · Odpovídající mince · Hra s ultimátem · Menšinová hra · Kámen-nůžky-papír · Pirátská hra · Hra s diktátorem · Hra s veřejnými statky · Blotto hry  ·Válka opotřebení  ·El Farol Bar problém  ·Stříhání dortů  ·Cournot hra  ·Deadlock  ·Dinerovo dilema  ·Hádej 2/3 průměru  ·Kuhn poker  ·Nash vyjednávací hra  ·Screening hra  ·Signalizační hra  ·Trust hra  ·Princezna a monstrum hra

Minimaxova věta · Purifikační věta · Folková věta · Zjevovací princip · Arrowova věta o nemožnosti