Funkce ztráty

Ztrátová funkce je ve statistice, teorii rozhodnutí a ekonomii funkce, která mapuje událost na reálné číslo představující ekonomické náklady nebo lítost spojenou s událostí.

Konkrétněji, ve statistikách ztrátová funkce představuje ztrátu (náklady v penězích nebo ztrátu v užitkovosti v nějakém jiném smyslu) spojenou s tím, že odhad je „nesprávný“ (odlišný od požadované nebo skutečné hodnoty) jako funkce míry nesprávnosti (obecně rozdíl mezi odhadovanou hodnotou a skutečnou nebo požadovanou hodnotou).

Formálně začínáme úvahou o některých modelech pravděpodobnosti, které popisují náhodnou proměnnou X a které jsou indexovány nějakým θ, které poskytujeme ztrátové funkci.

Intuitivněji si můžeme představit nějakou náhodnou proměnnou X jako naše „data“, protože je to množina věcí, o kterých bude rozhodovat rozhodovací pravidlo. Existuje několik možných způsobů, jak modelovat naše data X, které naše rozhodovací funkce může použít k rozhodování. Můžeme tedy uvažovat o θ jako o způsobu, jakým přistupujeme ke konkrétnímu modelu, ve kterém bychom chtěli pracovat: θ je prý index této rodiny pravděpodobnostních modelů.

Z praktičtějšího hlediska je důležité pochopit, že i když je lákavé uvažovat o ztrátových funkcích jako o nutně parametrických (protože se zdá, že berou θ jako „parametr“), skutečnost, že θ je nekonkrétní-dimenzionální, je s tímto pojmem zcela neslučitelná; například pokud je rodina pravděpodobnostních funkcí nespočetně nekonečná, θ indexuje nespočetně nekonečný prostor.

Odtud, vzhledem k množině A možných akcí, je rozhodovací pravidlo funkcí δ : → A.

Ztrátová funkce je reálná funkce s nižším ohraničením L na Θ × A pro některé θ ∈ Θ. Hodnota L(θ, δ(X)) je cena za akci δ(X) podle parametru θ.

Rozhodovací pravidlo provádí volbu pomocí kritéria optimálnosti. Mezi běžně používaná kritéria patří:

Hodnota samotné ztrátové funkce je náhodná veličina, protože závisí na výsledku náhodné veličiny X. Frekvenční i bayesovská statistická teorie zahrnují rozhodování na základě očekávané hodnoty ztrátové funkce: nicméně tato veličina je definována odlišně podle obou paradigmat.

Doporučujeme:  Subjektivní pohoda

Očekávaná ztráta ve frekvenčním kontextu se získá tak, že se vezme očekávaná hodnota s ohledem na rozdělení pravděpodobnosti, Pθ, pozorovaných dat, X. To je také označováno jako riziková funkce rozhodovacího pravidla δ a parametru θ. Zde rozhodovací pravidlo závisí na výsledku X. Riziková funkce je dána

V bayesovském přístupu je očekávání vypočítáno pomocí zadního rozdělení π* parametru θ:

Člověk by pak měl zvolit akci a*, která minimalizuje očekávanou ztrátu. Ačkoli to bude mít za následek výběr stejné akce, která by byla vybrána pomocí Bayesova rizika, důraz Bayesova přístupu je, že člověk má zájem pouze na výběru optimální akce podle skutečných pozorovaných dat, zatímco výběr skutečné Bayesovo optimální rozhodovací pravidlo, které je funkcí všech možných pozorování, je mnohem obtížnější problém.

Řádná statistická praxe vyžaduje výběr odhadu v souladu se skutečnou ztrátou zaznamenanou v souvislosti s konkrétním aplikovaným problémem. Při aplikovaném použití ztrátových funkcí tedy výběr, kterou statistickou metodu použít k modelování aplikovaného problému, závisí na znalosti ztrát, které budou zaznamenány z toho, že jsou chybné za konkrétních okolností problému, což vede k zavedení prvku teleologie do problémů vědeckého rozhodování.

Běžným příkladem je odhad „místa“. Za typických statistických předpokladů je průměrem nebo průměrem statistika pro odhad místa, která minimalizuje očekávanou ztrátu, ke které došlo v rámci funkce Taguči nebo čtvercové ztráty, zatímco medián je odhadcem, který minimalizuje očekávanou ztrátu, ke které došlo v rámci funkce absolutní ztráty rozdílu. Stále odlišné odhady by byly optimální za jiných, méně obvyklých okolností.

V ekonomii, když je agent rizikově neutrální, ztrátová funkce se jednoduše vyjadřuje v peněžních termínech, jako je zisk, příjem nebo majetek na konci období.

Ale pro rizikové averzní (nebo riziko milující) agenty, ztráta se měří jako záporná hodnota užitné funkce, která představuje spokojenost a je obvykle interpretována v ordinálních termínech spíše než v kardinálních (absolutních) termínech.

Doporučujeme:  Nosní souhlásky

Jsou možná i jiná měřítka nákladů, například úmrtnost nebo nemocnost v oblasti veřejného zdraví nebo bezpečnostní inženýrství.

Pro většinu optimalizačních algoritmů je žádoucí mít ztrátovou funkci, která je globálně spojitá a diferencovatelná.

Dvě velmi běžně používané ztrátové funkce jsou čtvercová ztráta, , a absolutní ztráta, . Nicméně absolutní ztráta má tu nevýhodu, že není diferencovatelný kolem . Čtvercová ztráta má tu nevýhodu, že má tendenci být ovládán odlehlých hodnot—při sčítání přes soubor ‚s (jako v ), konečný součet má tendenci být výsledkem několika zvláště-velké a-hodnoty, spíše než vyjádření průměrné a-hodnoty.

Ztrátové funkce v bayesovských statistikách

Jedním z důsledků bayesovské dedukce je, že kromě experimentálních dat ztrátová funkce sama o sobě zcela neurčuje rozhodnutí. Důležitý je vztah mezi ztrátovou funkcí a předchozí pravděpodobností. Je tedy možné mít dvě různé ztrátové funkce, které vedou ke stejnému rozhodnutí, když předchozí rozdělení pravděpodobnosti spojené s každou z nich kompenzují detaily každé ztrátové funkce.

Kombinace tří prvků předchozí pravděpodobnosti, dat a ztrátové funkce pak umožňuje rozhodování založené na maximalizaci subjektivní očekávané užitečnosti, což je koncept zavedený Leonardem J.

Savage také tvrdil, že při použití jiných než bayesovských metod, jako je minimax, by ztrátová funkce měla být založena na myšlence lítosti, tj. ztráta spojená s rozhodnutím by měla být rozdílem mezi důsledky nejlepšího rozhodnutí, které by mohlo být přijato, pokud by byly známy základní okolnosti, a rozhodnutí, které bylo ve skutečnosti přijato dříve, než byly známy.

Používání kvadratické ztrátové funkce je běžné, například při použití metod nejmenších čtverců nebo Tagučiho metod. Často je matematicky lépe ovladatelná než jiné ztrátové funkce kvůli vlastnostem rozptylů, stejně jako je symetrická: chyba nad cílem způsobí stejnou ztrátu jako stejná velikost chyby pod cílem. Pokud je cílem t, pak je kvadratická ztrátová funkce

Doporučujeme:  Vipassana

pro nějakou konstantu C; hodnota konstanty nemá žádný vliv na rozhodnutí, a může být ignorován nastavením ji rovná 1.

Mnohé běžné statistiky, včetně t-testů, regresních modelů, návrhu experimentů a mnoha dalších, používají teorii nejmenších čtverců Lineárních modelů, která je založena na Tagučiho ztrátové funkci.

Kvadratická ztrátová funkce se používá také v lineárně-kvadratických optimálních řídicích úlohách.