Budou oba vězni spolupracovat, nebo oba zradí, aby si snížili podmínky a skončili s delšími?
Vězeňské dilema představuje problém v teorii her. Původně ji zarámovali Merrill Flood a Melvin Dresher pracující v RAND v roce 1950. Albert W. Tucker hru formalizoval výplatou trestu odnětí svobody a dal jí jméno „Vězeňské dilema“ (Poundstone, 1992).
Ve své „klasické“ podobě je vězňovo dilema (PD) prezentováno následovně:
Pokud předpokládáme, že každý hráč dává přednost kratším trestům před delšími a že každý z hráčů nemá žádný užitek ze snížení trestu druhého hráče a že z rozhodnutí hráče nevyplývají žádné účinky na pověst, pak vězňovo dilema tvoří hru s nenulovým součtem, ve které dva hráči mohou každý „spolupracovat“ s druhým hráčem nebo od něj „přeběhnout“ (tj. zradit) druhého hráče. V této hře, stejně jako v každé teorii hry, je jedinou starostí každého jednotlivého hráče („vězně“) maximalizovat vlastní výplatu, bez ohledu na výplatu druhého hráče. Jedinečnou rovnováhou pro tuto hru je Pareto-suboptimální řešení – to znamená, že racionální volba vede oba hráče k tomu, aby oba hráli defekt, i když individuální odměna každého hráče by byla větší, kdyby oba hráli kooperativně.
V klasické formě této hry je spolupráce striktně ovládána přeběhnutím, takže jedinou možnou rovnováhou pro hru je pro všechny hráče přeběhnutí. Zjednodušeně řečeno, bez ohledu na to, co udělá druhý hráč, jeden hráč vždy získá větší užitek hraním defektu. Protože v každé situaci je hraní defektu prospěšnější než spolupráce, všichni racionálně uvažující hráči budou hrát defekt, všechny věci budou stejné.
V iterovaném vězňově dilematu se hra hraje opakovaně. Tak má každý hráč možnost „potrestat“ druhého hráče za předchozí nespolupracující hru. Spolupráce pak může vzniknout jako rovnovážný výsledek. Motivace k dezerci je překonána hrozbou trestu, což vede k možnosti kooperativního výsledku. Takže pokud se hra nekonečně opakuje, spolupráce může být podhrou dokonalou Nashovou rovnováhou i když oba hráči dezertující vždy zůstává rovnovážnou a existuje mnoho dalších rovnovážných výsledků.
V běžném používání může být označení „vězňovo dilema“ použito na situace, které striktně neodpovídají formálním kritériím klasických nebo iterativních her; například ty, ve kterých by dva subjekty mohly získat důležité výhody ze spolupráce nebo by mohly trpět tím, že tak neučiní, ale pro ně je pouze obtížné nebo nákladné, ne nutně nemožné, koordinovat své aktivity k dosažení spolupráce.
Strategie pro dilema klasického vězně
Dilema klasického vězně lze shrnout takto:
V této hře, bez ohledu na to, co si protivník vybere, dostane každý hráč vždy vyšší výplatu (nižší trest) za zradu; to znamená, že zrada je striktně dominantní strategie. Například vězeň A může přesně říci: „Bez ohledu na to, co vězeň B udělá, já osobně jsem na tom lépe, když zradím, než když budu mlčet. Proto bych měl zradit ve vlastním zájmu.“ Pokud se však druhý hráč chová podobně, pak oba zradí a oba dostanou nižší výplatu, než by dostali, kdyby mlčeli. Racionální sebestředná rozhodnutí vedou k tomu, že každý vězeň je na tom hůře, než kdyby se každý rozhodl snížit trest spolupachateli za cenu toho, že sám zůstane o něco déle ve vězení. Proto zdánlivé dilema. V teorii her to velmi elegantně ukazuje, že ve hře s nenulovým součtem nemusí být Nash Equilibrium Paretovým optimem.
Kostru hry můžeme odhalit tak, že ji zbavíme rámovacího zařízení pro vězně. Zobecněná podoba hry byla často používána v experimentální ekonomii. Následující pravidla dávají typickou realizaci hry.
Pokud hráč 1 (červená) defektuje a hráč 2 (modrá) spolupracuje, hráč 1 získá výplatu Pokušení k defektu ve výši 5 bodů, zatímco hráč 2 obdrží výplatu Suckera ve výši 0 bodů. Pokud oba spolupracují, získají výplatu Odměny za vzájemnou spolupráci ve výši 3 bodů každý, zatímco pokud oba defektují, získají výplatu Trestu za vzájemnou defekci ve výši 1 bodu. Matice výplat šachovnice s uvedením výplat je uvedena níže.
V terminologii „win-lose“ vypadá tabulka takto:
Tato bodová přiřazení jsou pro ilustraci uvedena libovolně. Lze je zobecnit následovně:
Kde T znamená Temptation to defect, R jako Reward for mutual cooperation, P jako Punishment for mutual defection a S jako Sucker’s payoff. Chcete-li být definovány jako vězňovo dilema, musí platit následující nerovnosti:
Tato podmínka zajišťuje, že rovnovážným výsledkem je přeběhnutí, ale že spolupráce Pareto dominuje rovnovážné hře. Kromě výše uvedené podmínky, pokud hru opakovaně hrají dva hráči, je třeba doplnit následující podmínku.
Pokud tato podmínka neplatí, pak plná spolupráce není nutně Pareto optimální, protože hráči jsou na tom kolektivně lépe tím, že každý hráč střídá spolupráci a defekt.
Tato pravidla zavedl kognitivní vědec Douglas Hofstadter a tvoří formální kanonický popis typické hry Vězeňské dilema.
Jednoduchý speciální případ nastává, když výhoda přeběhnutí nad spoluprací je nezávislá na tom, co spoluhráč dělá a cena přeběhnutí spoluhráčů je nezávislá na vlastní akci, tj. T+S = P+R.
Lidské chování v vězňově dilematu
Jeden experiment založený na jednoduchém dilematu zjistil, že přibližně 40% účastníků hrálo „spolupracovat“ (tj. mlčelo).
Opakované vězňovo dilema
Hrají-li dva hráči Vězeňské dilema více než jednou za sebou a mají-li v paměti alespoň jednu předchozí hru, nazývá se iterované Vězeňské dilema. Mezi výsledky, které ukázal nositel Nobelovy ceny Robert Aumann ve své práci z roku 1959, mohou racionální hráči, kteří spolu opakovaně jednají po neomezeně dlouhou dobu, udržet kooperativní výsledek. Zájem veřejnosti o iterované Vězeňské dilema (IPD) roznítil Robert Axelrod ve své knize Evoluce spolupráce (1984). V ní referuje o turnaji, který organizoval a v němž si účastníci musí znovu a znovu vybírat vzájemnou strategii a mají v paměti svá předchozí setkání. Axelrod pozval akademické kolegy po celém světě, aby vymysleli počítačové strategie, které by soutěžily v turnaji IPD. Programy, které byly přihlášeny, se značně lišily v algoritmické složitosti, počáteční nevraživosti, schopnosti odpuštění a tak dále.
Axelrod zjistil, že když se tato setkání opakovala po dlouhou dobu s mnoha hráči, z nichž každý měl jiné strategie, chamtivým strategiím se dlouhodobě dařilo velmi špatně, zatímco altruističtějším strategiím se dařilo lépe, jak se soudilo čistě podle vlastních zájmů. Použil to, aby ukázal možný mechanismus vývoje altruistického chování z mechanismů, které jsou zpočátku čistě sobecké, přirozeným výběrem.
Nejlepší deterministickou strategií byla „Tit for Tat“, kterou Anatol Rapoport vyvinul a přihlásil do turnaje. Byla nejjednodušší ze všech přihlášených programů, obsahovala pouze čtyři řádky BASICu a soutěž vyhrála. Strategií je jednoduše spolupracovat na první iteraci hry; poté hráč udělá to, co jeho soupeř na předchozím tahu. V závislosti na situaci může být o něco lepší strategií „Tit for Tat s odpuštěním“. Když soupeř zběhne, při dalším tahu hráč někdy spolupracuje tak jako tak, s malou pravděpodobností (kolem 1%-5%). To umožňuje občasné zotavení z uvěznění v cyklu zběhnutí. Přesná pravděpodobnost závisí na sestavě soupeřů.
Analýzou top-scoring strategií Axelrod uvedl několik podmínek nutných k tomu, aby strategie byla úspěšná.
Proto Axelrod dospěl k oxymoronově znějícímu závěru, že sobečtí jedinci pro své vlastní sobecké dobro mají tendenci být milí, odpouštějící a nezáviděnící.
Optimální (body-maximalizující) strategií pro jednorázovou hru PD je prostě zběhnutí; jak bylo vysvětleno výše, platí to bez ohledu na složení protivníků. Nicméně v iterované hře PD optimální strategie závisí na strategiích pravděpodobných protivníků a na tom, jak budou reagovat na zběhnutí a spolupráci. Vezměme si například populaci, kde každý pokaždé zběhne, s výjimkou jediného jedince, který se řídí strategií Tit-for-Tat. Tento jedinec je v mírné nevýhodě kvůli ztrátě v prvním kole. V takové populaci je optimální strategií pro daného jedince zběhnout pokaždé. V populaci s určitým procentem vždy-zběhlých a zbytek jsou hráči Tit-for-Tat, optimální strategie pro jednotlivce závisí na procentu a na délce hry.
Strategie zvaná Pavlov (příklad Win-Stay, Lose-Switch) spolupracuje při první iteraci a vždy, když hráč a spoluhráč dělali totéž při předchozí iteraci; Pavlov defektuje, když hráč a spoluhráč dělali různé věci při předchozí iteraci. Pro určitý rozsah parametrů Pavlov poráží všechny ostatní strategie tím, že upřednostňuje spoluhráče, kteří se podobají Pavlovovi.
Odvození optimální strategie se obecně provádí dvěma způsoby:
Ačkoli Tit-for-Tat je považován za nejrobustnější základní strategii, tým z Southamptonské univerzity v Anglii (vedený profesorem Nicholasem Jenningsem a skládající se z Rajdeep Dashe, Sarvapaliho Ramchurna, Alexe Rogerse, Perukrishnena Vytelinguma) představil novou strategii na 20. výročí soutěže Iterated Prisoner’s Dilemma, která se ukázala být úspěšnější než Tit-for-Tat. Tato strategie se opírala o spolupráci mezi programy, aby se dosáhlo nejvyššího počtu bodů za jeden program. Univerzita do soutěže přihlásila 60 programů, které byly navrženy tak, aby se na začátku rozpoznávaly pomocí série pěti až deseti tahů. Jakmile se toto rozpoznání uskutečnilo, jeden program vždy spolupracoval a druhý vždy dezertoval, čímž se zajistil maximální počet bodů pro přeběhlíka. Pokud by si program uvědomil, že hraje s hráčem mimo Southampton, neustále by dezertoval ve snaze minimalizovat skóre konkurenčního programu. Výsledkem bylo, že tato strategie skončila obsazením prvních tří pozic v soutěži a také řady pozic směrem ke dnu.
Tato strategie využívá skutečnosti, že v této konkrétní soutěži bylo povoleno více vstupů a že výkon týmu byl měřen výkonem hráče s nejvyšším skóre (což znamená, že použití sebeobětujících se hráčů byla forma minmaxingu). V soutěži, kde má člověk kontrolu pouze nad jedním hráčem, je Tit-for-Tat rozhodně lepší strategií. Kvůli tomuto novému pravidlu má tato soutěž také malý teoretický význam při analýze strategií jednoho agenta ve srovnání s Axelrodovým semifinálovým turnajem. Poskytla však rámec pro analýzu toho, jak dosáhnout kooperativních strategií v rámci více agentů, zejména v přítomnosti hluku. Ve skutečnosti, dlouho před tím, než se tento turnaj s novými pravidly hrál, Richard Dawkins ve své knize Sobecký gen poukázal na možnost, že takové strategie mohou vyhrát, pokud je povoleno více vstupů, ale poznamenal, že s největší pravděpodobností by je Axelrod nepovolil, pokud by byly předloženy. Spoléhá také na obcházení pravidel týkajících se vězňova dilematu v tom, že mezi oběma hráči není povolena žádná komunikace. Když se Southamptonské programy zapojí do úvodního „tance deseti tahů“, aby se navzájem poznaly, jen to posiluje, jak cenná může být komunikace při posouvání rovnováhy ve hře.
Pokud se iterované PD bude iterovat přesně N krát, pro nějakou známou konstantu N, pak je vždy hra teoreticky optimální ve všech kolech přeběhnout. Jedinou možnou Nashovou rovnováhou je vždy přeběhnout. Důkaz vypadá takto: člověk může stejně dobře přeběhnout v posledním tahu, protože soupeř nebude mít šanci hráče potrestat. Proto oba přeběhnou v posledním tahu. Hráč tedy může stejně tak dobře přeběhnout v předposledním tahu, protože soupeř přeběhne v posledním tahu bez ohledu na to, co se stane, a tak dále. Aby mohla vzniknout spolupráce mezi teoreticky racionálně uvažujícími hráči hry, musí být celkový počet kol náhodný, nebo alespoň pro hráče neznámý. Nicméně i v tomto případě není vždy defekt již striktně dominantní strategií, pouze Nashovou rovnováhou. Nadracionální strategií je v tomto případě spolupráce proti nadracionálnímu soupeři a v limitu velkého pevného N souhlasí experimentální výsledky strategií s nadracionální verzí, nikoli s tou racionální.
Dalším podivným případem je vězňovo dilema „hraj věčně“. Hra se nekonečně mnohokrát opakuje a hráčovo skóre je průměr (vhodně vypočtený).
Vězňova hra na dilema je zásadní pro určité teorie o lidské spolupráci a důvěře. Za předpokladu, že PD může modelovat transakce mezi dvěma lidmi vyžadujícími důvěru, může být kooperativní chování v populacích modelováno verzí hry pro více hráčů, iterovanou. V důsledku toho během let fascinovala mnoho učenců. V roce 1975 odhadli Grofman a Pool počet vědeckých článků, které se jí věnovaly, na více než 2000. Dilema iterovaného vězně bylo také označováno jako „hra na mír a válku“.
Kontinuální Iterované vězeňské dilema
Většina prací o dilematu iterovaného vězně se soustředila na diskrétní případ, kdy hráči buď spolupracují, nebo přebíhají, protože tento model je poměrně jednoduché analyzovat. Někteří výzkumníci se však podívali na modely dilematu kontinuálního iterovaného vězně, v němž jsou hráči schopni variabilně přispívat k druhému hráči. Le a Boyd zjistili, že v takových situacích se spolupráce vyvíjí mnohem hůře než v dilematu diskrétního vězně. Základní intuice pro tento výsledek je přímočará: v dilematu kontinuálního vězně, pokud populace začíná v nespolupracující rovnováze, hráči, kteří jsou jen nepatrně více spolupracující než nespolupracující, získají jen malý užitek z toho, že se stýkají mezi sebou. Naproti tomu v dilematu diskrétního vězně dostávají kooperátoři Tit-for-Tat velký užitek z toho, že se stýkají mezi sebou v nespolupracující rovnováze, oproti nespolupracujícím. Protože Příroda pravděpodobně nabízí více příležitostí pro variabilní spolupráci spíše než striktní dichotomii spolupráce nebo zběhnutí, dilema souvislého vězně může pomoci vysvětlit, proč jsou reálné příklady spolupráce typu Tit-for-Tat v Přírodě extrémně vzácné (např. Hammerstein), i když Tit-for-Tat se v teoretických modelech zdá robustní.
Studijní psychologie a teorie her
Tam, kde se hráči her mohou naučit odhadovat pravděpodobnost zběhnutí ostatních hráčů, je jejich vlastní chování ovlivněno jejich zkušenostmi s chováním ostatních hráčů. Jednoduché statistiky ukazují, že nezkušení hráči mají celkově spíše atypicky dobré nebo špatné interakce s ostatními hráči. Pokud jednají na základě těchto zkušeností (tím, že zběhnou nebo spolupracují více, než by jinak jednali), je pravděpodobné, že budou v budoucích transakcích trpět. S přibývajícími zkušenostmi se získává pravdivější dojem o pravděpodobnosti zběhnutí a hraní her se stává úspěšnějším. Rané transakce, které zažívají nedospělí hráči, budou mít pravděpodobně větší vliv na jejich budoucí hraní, než by takové transakce ovlivnily dospělé hráče. Tento princip částečně vysvětluje, proč jsou formativní zkušenosti mladých lidí tak vlivné a proč se například ti, kteří jsou obzvláště zranitelní šikanou, někdy sami stávají tyrany.
Pravděpodobnost zběhnutí v populaci může být snížena zkušenostmi se spoluprací v dřívějších hrách umožňujících vybudovat důvěru. Z toho vyplývá, že sebeobětavé chování může v některých případech posílit morální vlákno skupiny. Pokud je skupina malá, je pravděpodobnější, že se pozitivní chování vzájemně přiživí a povzbudí jednotlivce v rámci této skupiny, aby pokračovali ve spolupráci. To je spojeno s dvojím dilematem povzbuzovat ty lidi, kterým by člověk pomohl, aby se oddávali chování, které by je mohlo ohrozit. Takové procesy jsou hlavním předmětem zájmu v rámci studia recipročního altruismu, výběru skupiny, výběru příbuzných a morální filozofie.
Nadracionalita Douglase Hofstadtera
Douglas Hofstadter ve svých Metamagických tezích navrhl, že definice „racionálního“, která vedla „racionální“ hráče k dezerci, je chybná. Navrhl, že existuje jiný typ racionálního chování, který nazval „nadracionální“, kde hráči berou v úvahu, že druhá osoba je pravděpodobně nadracionální, jako oni. Nadracionální hráči se chovají identicky a vědí, že se budou chovat identicky. Berou to v úvahu předtím, než maximalizují své výplaty, a proto spolupracují.
Tento pohled na jednorázovou PD vede ke spolupráci následovně:
Pokud však nadracionální hráč hraje proti racionálnímu soupeři, odsedí si desetiletý trest a racionální hráč bude volný.
Jednorázová spolupráce je v lidské kultuře pozorována všude tam, kde existují náboženské a etické kodexy.
Nadracionalitu akademici nestudují, protože racionalita vylučuje jakékoli nadracionální chování.
Zatímco se někdy má za to, že morálka musí zahrnovat omezení vlastních zájmů, David Gauthier proslule tvrdí, že spolupráce v dilematu vězňů na morálních principech je v souladu s vlastními zájmy a axiomy teorie her.[Jak odkazovat a odkazovat na shrnutí nebo text] Podle jeho názoru je nejrozumnější vzdát se straightward maximalizace a místo toho přijmout dispozice omezené maximalizace, podle které se člověk rozhodne spolupracovat ve víře, že soupeř odpoví stejnou volbou, zatímco v klasickém PD je výslovně stanoveno, že odpověď soupeře nezávisí na volbě hráče. Tato forma kontraktářství tvrdí, že dobré morální myšlení je jen povznesenou a jemně strategickou verzí základního uvažování o koncích prostředků.
Douglas Hofstadter vyjadřuje silné osobní přesvědčení, že matematická symetrie je posílena morální symetrií, po vzoru Kantovského kategorického imperativu: zběhnout v naději, že druhý hráč spolupracuje, je morálně neobhajitelné.[Jak odkazovat a odkaz na shrnutí nebo text] Pokud se hráči chovají k sobě navzájem, jak by se chovali k sobě, pak budou spolupracovat.
Tyto konkrétní příklady, zahrnující vězně a záměnu pytlů a tak dále, se mohou zdát vykonstruované, ale ve skutečnosti existuje mnoho příkladů lidské interakce i interakcí v přírodě, které mají stejnou návratnost. Vězňovo dilema je proto zajímavé pro společenské vědy, jako je ekonomie, politika a sociologie, stejně jako pro biologické vědy, jako je etologie a evoluční biologie. Mnoho přírodních procesů bylo abstrahováno do modelů, ve kterých jsou živé bytosti zapojeny do nekonečných her Vězňovo dilema (PD). Tato široká použitelnost PD dává hře její podstatný význam.
Například v politologii se scénář PD často používá k ilustraci problému dvou států zapojených do závodů ve zbrojení. Oba zdůvodní, že mají dvě možnosti, buď zvýšit vojenské výdaje, nebo uzavřít dohodu o omezení zbraní. Ani jeden stát si nemůže být jistý, že ten druhý takovou dohodu dodrží; proto oba inklinují k vojenské expanzi. Paradoxem je, že oba státy jednají racionálně, ale dosahují zjevně iracionálního výsledku. To by se dalo považovat za důsledek teorie odstrašení.
Při řízení programu a vývoji technologií se PD vztahuje na vztah mezi zákazníkem a vývojářem. Kapitán Dan Ward, důstojník amerického letectva, zkoumal Dilema manažera programu v článku publikovaném v časopise Defense AT&L, který se zabývá obrannými technologiemi.
PD se často vyskytuje v cyklistických závodech, například na Tour de France. Vezměme si dva cyklisty v polovině závodu, s pelotonem (větší skupina) ve velké vzdálenosti za nimi. Oba jezdci často spolupracují (vzájemná spolupráce) tím, že se dělí o těžké zatížení přední pozice, kde není úkryt před větrem. Pokud se ani jeden z jezdců nesnaží udržet náskok, peloton je brzy dožene (vzájemné zběhnutí). Často viděný scénář je, že jeden jezdec dělá těžkou práci sám (spolupracuje), udržuje oba před pelotonem. Blíže k cíli (kde hrozba pelotonu zmizela) se hra stává jednoduchou hrou s nulovým součtem, kdy se každý jezdec snaží za každou cenu vyhnout zvýhodnění druhého jezdce ve vířivém proudu. Pokud se v dilematu předchozích vězňů vyskytl (jediný) zběhlý jezdec, je to obvykle on, kdo tuto hru s nulovým součtem vyhraje, protože ušetřil energii ve vířivém proudu spolupracujícího jezdce. Přístup spolupracujícího jezdce se může zdát extrémně naivní, ale často nemá jinou možnost, když mají oba jezdci odlišné fyzické profily. Spolupracující jezdec má typicky vytrvalostní profil, zatímco přebíhající jezdec bude s větší pravděpodobností sprinter. Při průběžném zaujímání čelní pozice dvojice se „spolupracující“ jezdec pouze snaží ujet přebíhajícímu sprinterovi s využitím jeho vytrvalostní výhody na dlouhé vzdálenosti, čímž se vyhne souboji ve sprintu v cíli, který by nutně prohrál, i kdyby sprintující jezdec spolupracoval. Těsně po úniku z pelotonu je rozdíl mezi vytrvalostí a sprinterem méně důležitý, a proto lze v této fázi závodu obvykle pozorovat vzájemnou spolupráci PD. Je pravděpodobné, že právě tato téměř nevyhnutelná přítomnost PD (a její přechod ve hrách s nulovým součtem) dělá z cyklistiky vzrušující sport ke sledování.
PD téměř neplatí pro běžecké sporty, kvůli zanedbatelnému významu odporu vzduchu (a úkrytu před ním).
Ve středoškolském wrestlingu někdy účastníci záměrně ztrácejí nepřirozeně velké množství váhy, aby mohli soupeřit s lehčími protivníky. Přitom účastníci zjevně nejsou na své nejvyšší úrovni fyzické a atletické kondice a přesto často nakonec stejně soupeří se stejnými soupeři, kteří se také řídili touto praxí (vzájemné přebíhání). Výsledkem je snížení úrovně soutěže. Pokud si však účastník udrží svou přirozenou váhu (spolupráce), bude s největší pravděpodobností soupeřit se silnějším soupeřem, který výrazně zhubl.
Reklama je někdy uváděna jako skutečný životní příklad vězňova dilematu. Když byla reklama na cigarety ve Spojených státech legální, konkurenční výrobci cigaret se museli rozhodnout, kolik peněz utratí za reklamu. Účinnost reklamy Firmy A byla částečně určena reklamou prováděnou Firmou B. Stejně tak je zisk z reklamy pro Firmu B ovlivněn reklamou prováděnou Firmou A. Pokud se Firma A i Firma B rozhodnou inzerovat během daného období, reklama se zruší, příjmy zůstanou konstantní a výdaje se zvýší kvůli nákladům na reklamu. Obě firmy by měly prospěch z omezení reklamy. Pokud by se však Firma B rozhodla inzerovat, Firma A by mohla mít velký prospěch z reklamy. Nicméně optimální množství reklamy jedné firmy závisí na tom, kolik reklamy provede druhá firma. Jelikož nejlepší strategie závisí na tom, co si vybere druhá firma, neexistuje žádná dominantní strategie a nejedná se o vězeňské dilema, ale spíše o příklad honu na jelena. Výsledek je však podobný v tom, že obě firmy by na tom byly lépe, kdyby inzerovaly méně než v rovnováze. Někdy se kooperativní chování v obchodních situacích objeví. Například výrobci cigaret podpořili vytvoření zákonů zakazujících reklamu na cigarety s vědomím, že by to snížilo náklady a zvýšilo zisky v celém odvětví. Tato analýza bude pravděpodobně relevantní v mnoha jiných obchodních situacích zahrnujících reklamu.
Bez vymahatelných dohod jsou členové kartelu také zapojeni do dilematu vězňů (více hráčů). „Spolupracovat“ obvykle znamená držet ceny na předem dohodnuté minimální úrovni. „Zběhnout“ znamená prodávat pod touto minimální úrovní a okamžitě krást obchody (a zisky) ostatním členům kartelu. Paradoxně antimonopolní orgány chtějí, aby si potenciální členové kartelu vzájemně přeběhli a zajistili tak co nejnižší ceny pro spotřebitele.
Ve vydání Big Brother (Velká Británie) z roku 2008 bylo dilema aplikováno na dva ze spolubydlících. K dispozici byl fond na odměny ve výši 50 000 liber. Pokud by se spolubydlící rozhodli podělit o fond na odměny, každý by dostal 25 000 liber. Pokud by se jeden rozhodl podělit a druhý by se rozhodl vzít, ten, kdo by to vzal, by dostal celých 50 000 liber. Pokud by se oba rozhodli vzít, oba spolubydlící by nedostali nic. Spolubydlící měli minutu na prodiskutování svého rozhodnutí a dostali možnost lhát. Oba spolubydlící prohlásili, že by se podělili o fond na odměny, ale oba mohli potenciálně lhát. Když byli požádáni velkým bratrem, aby poskytli své konečné odpovědi, oba spolubydlící se skutečně rozhodli podělit, a tak každý vyhrál 25 000 liber.
Protože neexistuje žádný mechanismus osobní volby, který by ovlivňoval rozhodování druhých, spoléhá tento typ myšlení na korelace mezi chováním, nikoli na příčinnou souvislost. Kvůli této vlastnosti si ti, kdo nerozumí nadracionalitě, ji často pletou s magickým myšlením. Bez nadracionality vyžaduje nejen drobné krádeže, ale i dobrovolné hlasování široce rozšířené magické myšlení, protože nevolič je svobodným jezdcem na demokratickém systému.
Hofstadter kdysi naznačil, že lidé často shledávají problémy, jako je problém PD, snadněji pochopitelnými, když je ilustrován formou jednoduché hry nebo kompromisem. Jedním z několika příkladů, které použil, byla „výměna uzavřených tašek“:
V této hře je přeběhnutí vždy nejlepší cestou, což znamená, že racionální agenti nikdy hrát nebudou. Nicméně v tomto případě oba hráči spolupracující a oba hráči přebíhající ve skutečnosti dávají stejný výsledek, takže šance na vzájemnou spolupráci, i v opakovaných hrách, je malá.
Přítel nebo nepřítel? je herní pořad, který se vysílal v letech 2002 až 2005 na Game Show Network ve Spojených státech. Je to příklad vězňova dilematu hra testovaná skutečnými lidmi, ale v umělém prostředí. V herní show soutěží tři páry lidí. Když je každý pár vyřazen, hrají hru Prisoner’s Dilemma, aby určili, jak se jejich výhra rozdělí. Pokud oba spolupracují (Přítel), dělí se o výhru 50:50. Pokud jeden spolupracuje a druhý chybuje (Nepřítel), přeběhlík dostane všechny výhry a spolupracující nedostane nic. Pokud oba chybují, oba odcházejí s prázdnou. Všimněte si, že výplatní matice je trochu odlišná od standardní, jak je uvedeno výše, protože výplaty za „oba vady“ a „spolupracují, zatímco soupeř chybuje“ případy jsou totožné. To dělá případ „obou vad“ slabou rovnováhou, ve srovnání s tím, že je to přísná rovnováha v dilematu standardního vězně. Pokud víte, že váš soupeř bude volit Nepřítele, pak vaše volba nemá vliv na vaši výhru. V určitém smyslu má Friend nebo Foe výplatní model mezi „Prisoner’s Dilemma“ a „Chicken“.
Tato výplatní matice byla později použita v britských televizních pořadech Shafted a Golden Balls.
Normal-form game · Extensive-form game · Cooperative game · Information set · Preference
Nashova rovnováha · Podherní dokonalost · Bayesovská-Nashova · Dokonalá Bayesovská · Třesoucí se ruka · Správná rovnováha · Epsilonová rovnováha · Korelovaná rovnováha · Sekvenční rovnováha · Kvazidokonalá rovnováha · Evolučně stabilní strategie · Riziková dominance · Paretova efektivita
Dominantní strategie · Pure strategy · Mixed strategy · Tit for tat · Grim trigger · Collusion · Backward induction
Symetrická hra · Perfektní informace · Dynamická hra · Sekvenční hra · Opakovaná hra · Signalizační hra · Levné povídání · Hra s nulovým součtem · Mechanismus design · Vyjednávací problém · Stochastická hra · Nontransitivní hra · Globální hry
Vězeňské dilema · Cestovatelské dilema · Koordinační hra · Kuře · Dobrovolnické dilema · Aukce dolarů · Bitva pohlaví · Lov jelenů · Odpovídající mince · Hra s ultimátem · Menšinová hra · Kámen-nůžky-papír · Pirátská hra · Hra s diktátorem · Hra s veřejnými statky · Blotto hry ·Válka opotřebení ·El Farol Bar problém ·Stříhání dortů ·Cournot hra ·Deadlock ·Dinerovo dilema ·Hádej 2/3 průměru ·Kuhn poker ·Nash vyjednávací hra ·Screening hra ·Signalizační hra ·Trust hra ·Princezna a monstrum hra
Minimaxova věta · Purifikační věta · Folková věta · Zjevovací princip · Arrowova věta o nemožnosti