Bayesovská hra

V teorii her je bayesovská hra taková hra, ve které jsou informace o vlastnostech ostatních hráčů (tj. výplaty) neúplné. Podle rámce Johna C. Harsanyiho může být bayesovská hra modelována zavedením Přírody jako hráče ve hře. Příroda přiřazuje každému hráči náhodnou proměnnou, která by mohla brát hodnoty typů pro každého hráče a přiřazovat k těmto typům pravděpodobnosti nebo funkci hustoty pravděpodobnosti (v průběhu hry příroda náhodně vybírá typ pro každého hráče podle rozdělení pravděpodobnosti napříč typovým prostorem každého hráče). Harsanyiho přístup k modelování bayesovské hry takovým způsobem umožňuje, aby se hra s neúplnými informacemi stala hrami s nedokonalými informacemi (ve kterých není historie hry dostupná všem hráčům). Typ hráče určuje výplatní funkci tohoto hráče a pravděpodobnost spojená s typem je pravděpodobnost, že hráč, pro kterého je typ určen, je tímto typem. V bayesovské hře neúplnost informací znamená, že alespoň jeden hráč si není jistý typem (a tedy výplatní funkcí) jiného hráče.

Takové hry se nazývají bayesovské kvůli pravděpodobnostní analýze, která je ve hře obsažena. Hráči mají počáteční přesvědčení o typu každého hráče (kde víra je rozdělení pravděpodobnosti nad možnými typy pro hráče) a mohou aktualizovat svá přesvědčení podle Bayesova pravidla tak, jak se hra odehrává ve hře, tj. víra, kterou hráč chová o typu jiného hráče, se může měnit na základě akcí, které hrál. Nedostatek informací, které mají hráči k dispozici, a modelování přesvědčení znamená, že takové hry se používají také k analýze nedokonalých informačních scénářů.

Normální forma reprezentace non-bayesovské hry s perfektními informacemi je specifikace strategických prostorů a výplatních funkcí hráčů. Strategie pro hráče je kompletní akční plán, který pokrývá každou eventualitu hry, i když tato eventualita nemůže nikdy nastat. Strategický prostor hráče je tedy množinou všech strategií, které má hráč k dispozici. Výplatní funkce je funkce od množiny strategických profilů až po množinu výplat (obvykle množinu reálných čísel), kde strategický profil je vektor specifikující strategii pro každého hráče.

Příkladem bayesovských her jsou signální hry. V takové hře zná informovaný účastník (agent) jejich typ, zatímco neinformovaný účastník (zmocnitel) nezná (agent) typ. V některých takových hrách je možné, aby zmocnitel odvodil typ agenta na základě činností, které agent provádí (ve formě signálu vyslaného zmocniteli) v tzv. separační rovnováze. Konkrétnějším příkladem signalizační hry je model trhu práce. Hráči jsou žadatel (agent) a zaměstnavatel (zmocnitel). Existují dva typy žadatelů, kvalifikovaní a nekvalifikovaní, ale zaměstnavatel neví, který žadatel je, ale ví, že 90% žadatelů je nekvalifikovaných a 10% je kvalifikovaných (typ „kvalifikovaný“ se vyskytuje s 10% šancí a nekvalifikovaný s 90% šancí). Zaměstnavatel nabídne žadateli smlouvu na základě toho, jak produktivní podle něj bude. Kvalifikovaní pracovníci jsou velmi produktivní (generující velký výdělek pro zaměstnavatele) a nekvalifikovaní pracovníci jsou neproduktivní (generující nízký výdělek pro zaměstnavatele). Výdělek zaměstnavatele je tak určen dovedností uchazeče (pokud uchazeč přijme smlouvu) a vyplacenou mzdou.

Akční prostor žadatele se skládá ze dvou akcí, vezměte si vysokoškolské vzdělání, nebo ne. Pro kvalifikovaného pracovníka je to méně nákladné (protože neplatí extra školné, považuje třídy za méně zdanitelné atd.). Akční prostor zaměstnavatele je množina (řekněme) přirozených čísel, která představují mzdu žadatele (akční prostor žadatele by mohl být rozšířen o přijetí mzdy, v takovém případě by bylo vhodnější hovořit o jeho strategickém prostoru). Zaměstnavatel by mohl nabídnout mzdu, která by kvalifikovanému žadateli dostatečně kompenzovala získání vysokoškolského vzdělání, ale ne nekvalifikovanému žadateli, což by vedlo k separační rovnováze, kdy kvalifikovaní žadatelé jdou na univerzitu a nekvalifikovaní žadatelé ne a kvalifikovaní žadatelé (pracovníci) mají vysokou mzdu, zatímco nekvalifikovaní žadatelé (pracovníci) dostávají nízkou mzdu.

Ve hře načrtnuté výše je rozhodující, že zaměstnavatel si vybírá svůj postup (nabízenou mzdu) podle svého přesvědčení o tom, jak je žadatel kvalifikovaný, a toto přesvědčení je částečně dáno signálem, který vysílá žadatel. Zaměstnavatel začíná hru s počátečním přesvědčením o typu žadatele (nekvalifikovaný s 90% šancí), ale v průběhu hry může být toto přesvědčení aktualizováno (v závislosti na výplatách různých typů žadatelů) na 0% nekvalifikovaného, pokud dodržuje vysokoškolské vzdělání, nebo 100% nekvalifikovaného, pokud tak nečiní.

V jiné než bayesovské hře je profil strategie Nashovou rovnováhou, pokud je každá strategie v tomto profilu nejlepší odpovědí na každou jinou strategii v profilu, tj. neexistuje žádná strategie, kterou by hráč mohl hrát, která by přinesla vyšší výplatu vzhledem ke všem strategiím, které hrají ostatní hráči. V bayesovské hře (kde jsou hráči modelováni jako rizikově neutrální) se racionální hráči snaží maximalizovat očekávanou výplatu vzhledem ke svému přesvědčení o ostatních hráčích (v obecném případě, kdy hráči mohou mít averzi k riziku nebo milovat riziko, je předpoklad, že od hráčů se očekává maximalizace užitku). Bayesovská Nashova rovnováha je definována jako profil strategie a přesvědčení specifikovaná pro každého hráče o typech ostatních hráčů, která maximalizuje očekávanou výplatu pro každého hráče vzhledem k jeho přesvědčení o typech ostatních hráčů a vzhledem ke strategiím, které hrají ostatní hráči.

Tento koncept řešení přináší nevěrohodnou rovnováhu v dynamických hrách, kde nejsou kladena žádná další omezení na názory hráčů. To dělá z Bayesovské Nashovy rovnováhy chybný nástroj, kterým lze analyzovat dynamické hry s neúplnými informacemi.

Dokonalá bayesovská rovnováha

Bayesovská Nashova rovnováha má za následek určitou nevěrohodnou rovnováhu v dynamických hrách, kde se hráči střídají postupně a ne současně. Určitá nevěrohodná rovnováha může vyplývat ze skutečnosti, že v dynamické hře mohou hráči rozumně měnit své přesvědčení v průběhu hry. V Bayesovské Nashově rovnováze pro to není k dispozici žádný postup. Podobně nevěrohodná rovnováha může vznikat stejným způsobem, jako nevěrohodná Nashova rovnováha vzniká ve hrách s perfektními a úplnými informacemi, jako jsou neuvěřitelné hrozby a sliby. Taková rovnováha může být odstraněna v perfektních a úplných informačních hrách použitím subgame perfektní Nashovy rovnováhy. Není však vždy možné využít tohoto konceptu řešení v nekompletních informačních hrách, protože takové hry obsahují non-singletonové informační sady a protože subhry musí obsahovat kompletní informační sady, někdy existuje pouze jedna subhra – celá hra – a tak je každá Nashova rovnováha triviálně subherní perfektní. I když má hra více než jednu subhru, neschopnost subherní dokonalosti proříznout se informačními sadami může vést k tomu, že nevěrohodná rovnováha nebude odstraněna.

Pro upřesnění rovnováhy vytvořené Bayesovským konceptem Nashova řešení nebo dokonalostí subhry lze použít koncept dokonalého Bayesovského rovnovážného řešení. PBE se nese v duchu dokonalosti subhry v tom, že vyžaduje, aby následná hra byla optimální. Klade však hráčskou víru na rozhodovací uzly, které umožňují uspokojivěji řešit pohyby v jiných než singletonových informačních sadách.

Dosud se v diskusích o bayesovských hrách předpokládalo, že informace jsou dokonalé (nebo pokud nedokonalé, je hra souběžná). Při zkoumání dynamických her však může být nutné mít prostředky k modelování nedokonalých informací. PBE to umožňuje: hráči umísťují víry na uzly vyskytující se v jejich informačních souborech, což znamená, že informační soubor může být generován přírodou (v případě neúplných informací) nebo jinými hráči (v případě nedokonalých informací).

K víře hráčů v bayesovských hrách lze v PBE přistupovat přísněji. Systém víry je přiřazení pravděpodobností ke každému uzlu ve hře tak, že součet pravděpodobností v libovolné informační množině je 1. Víra hráče jsou přesně ty pravděpodobnosti uzlů ve všech informačních množinách, ve kterých má daný hráč tah (víra hráče může být specifikována jako funkce od spojení jeho informačních množin do [0,1]). Systém víry je konzistentní pro daný profil strategie tehdy a jen tehdy, když pravděpodobnost přiřazená systémem ke každému uzlu je vypočítána jako pravděpodobnost dosažení tohoto uzlu vzhledem k profilu strategie, tj. podle Bayesova pravidla.

Pojem sekvenční racionality je to, co určuje optimálnost následné hry v PBE. Profil strategie je sekvenčně racionální v určité informační sadě pro určitý systém víry tehdy a jen tehdy, když očekávaný přínos hráče, jehož informační sada to je (tj. kdo má tah v této informační sadě), je maximální vzhledem ke strategiím, které hrají všichni ostatní hráči. Profil strategie je sekvenčně racionální pro určitý systém víry tehdy, když splňuje výše uvedené pro každou informační sadu.

Dokonalá Bayesova rovnováha je profil strategie a systém víry takový, že strategie jsou sekvenčně racionální vzhledem k systému víry a systém víry je konzistentní, pokud je to možné, vzhledem k profilu strategie.

Je nutné stanovit klauzuli ‚všude tam, kde je to možné‘, protože některé informační množiny nemusí být dosaženy s nenulovou pravděpodobností vzhledem k profilu strategie, a proto Bayesovo pravidlo nemůže být použito pro výpočet pravděpodobnosti v uzlech v těchto množinách. Takové informační množiny jsou prý mimo rovnovážnou cestu a jakékoliv víry mohou být přiřazeny k nim.

Bayesovská hra s nedokonalými informacemi zastoupenými v rozsáhlé formě

Informace ve hře na levé straně jsou nedokonalé, protože hráč 2 neví, co hráč 1 dělá, když přijde hrát. Pokud jsou oba hráči racionální a oba vědí, že oba hráči jsou racionální a vše, co je známo jakémukoli hráči, je známo každému hráči (tj. hráč 1 ví hráč 2 ví, že hráč 1 je racionální a hráč 2 to ví, atd. ad infinitum – všeobecně známo), hra ve hře bude následující podle dokonalé Bayesovské rovnováhy:

Hráč 2 nemůže sledovat tah hráče 1. Hráč 1 by chtěl oklamat hráče 2, aby si myslel, že hrál U, když skutečně hrál D, takže hráč 2 bude hrát D‘ a hráč 1 dostane 3. Ve skutečnosti ve druhé hře existuje dokonalá Bayesovská rovnováha, kde hráč 1 hraje D a hráč 2 hraje U‘ a hráč 2 drží víru, že hráč určitě bude hrát D (tj. hráč umístí pravděpodobnost 1 na dosažený uzel, pokud hráč 1 hraje D). V této rovnováze je každá strategie racionální vzhledem k zastávané víře a každá víra je v souladu s hranými strategiemi. V tomto případě je dokonalá Bayesovská rovnováha jedinou Nashovou rovnováhou.

Normal-form game · Extensive-form game · Cooperative game · Information set · Preference

Nashova rovnováha · Podherní dokonalost · Bayesovská-Nashova · Dokonalá Bayesovská · Třesoucí se ruka · Správná rovnováha · Epsilonová rovnováha · Korelovaná rovnováha · Sekvenční rovnováha · Kvazidokonalá rovnováha · Evolučně stabilní strategie · Riziková dominance · Paretova efektivita

Dominantní strategie · Pure strategy · Mixed strategy · Tit for tat · Grim trigger · Collusion · Backward induction

Symetrická hra · Perfektní informace · Dynamická hra · Sekvenční hra · Opakovaná hra · Signalizační hra · Levné povídání · Hra s nulovým součtem · Mechanismus design · Vyjednávací problém · Stochastická hra · Nontransitivní hra · Globální hry

Vězeňské dilema · Cestovatelské dilema · Koordinační hra · Kuře · Dobrovolnické dilema · Aukce dolarů · Bitva pohlaví · Lov jelenů · Odpovídající mince · Hra s ultimátem · Menšinová hra · Kámen-nůžky-papír · Pirátská hra · Hra s diktátorem · Hra s veřejnými statky · Blotto hry  ·Válka opotřebení  ·El Farol Bar problém  ·Stříhání dortů  ·Cournot hra  ·Deadlock  ·Dinerovo dilema  ·Hádej 2/3 průměru  ·Kuhn poker  ·Nash vyjednávací hra  ·Screening hra  ·Signalizační hra  ·Trust hra  ·Princezna a monstrum hra

Minimaxova věta · Purifikační věta · Folková věta · Zjevovací princip · Arrowova věta o nemožnosti