Giniho koeficient rozdělení národního důchodu ve světě (podle údajů z roku 2009)
Giniho koeficient je měřítkem nerovnosti rozdělení, přičemž hodnota 0 vyjadřuje dokonalou rovnost, kdy všichni mají stejný podíl na příjmech, a hodnota 1 vyjadřuje maximální nerovnost, kdy všechny příjmy má pouze jedna osoba. Své uplatnění našel při studiu nerovností v tak rozmanitých oborech, jako je sociologie, ekonomie, zdravotnictví, ekologie, chemie, inženýrství a zemědělství.
Běžně se používá jako měřítko nerovnosti příjmů nebo bohatství. Celosvětově se Giniho koeficienty pro příjmy pohybují v rozmezí přibližně od 0,23 (Švédsko) do 0,70 (Namibie), i když ne všechny země byly hodnoceny.
Grafické znázornění Giniho koeficientuGrafické znázornění ukazuje, že Giniho koeficient se rovná podílu plochy označené „A“ a součtu ploch označených „A“ a „B“ (tj. Gini = A/(A+B)). Je také roven 2*A, protože A+B = 0,5 (protože osy mají stupnici od 0 do 1).
Giniho koeficient se obvykle definuje matematicky na základě Lorenzovy křivky, která znázorňuje podíl celkového příjmu obyvatelstva (osa y), který kumulativně získává x % nejnižšího příjmu obyvatelstva (viz graf). Úsečka na 45 stupních tedy představuje dokonalou rovnost příjmů. Giniho koeficient si pak lze představit jako poměr plochy, která leží mezi přímkou rovnosti a Lorenzovou křivkou (v diagramu označena „A“), k celkové ploše pod přímkou rovnosti (v diagramu označeny „A“ a „B“); tj. koeficient G=A/(A+B).
Giniho koeficient se může pohybovat od 0 do 1; někdy se vyjadřuje v procentech v rozmezí 0 až 100. Přesněji řečeno, horní hranice Giniho koeficientu se rovná 1 pouze v populacích nekonečné velikosti. V populaci o velikosti N je horní hranice rovna 1 – 2 / (N + 1).
Nízký Giniho koeficient znamená rovnoměrnější rozdělení, přičemž 0 odpovídá úplné rovnosti, zatímco vyšší Giniho koeficient znamená nerovnoměrnější rozdělení, přičemž 1 odpovídá úplné nerovnosti. Aby byl výpočet platný, nesmí být rozděleny žádné záporné statky. Pokud se tedy Giniho koeficient používá k popisu nerovnosti příjmů domácností, pak žádná domácnost nemůže mít záporný příjem. Pokud se použije jako měřítko příjmové nerovnosti, bude nejnerovnější společnost taková, ve které jediný člověk dostává 100 % celkového příjmu a ostatní lidé nedostávají žádný (G=1); a nejrovnější společnost bude taková, ve které každý člověk dostává stejný příjem (G=0).
Někteří považují za intuitivnější (a matematicky ekvivalentní) uvažovat o Giniho koeficientu jako o polovině relativního průměrného rozdílu. Průměrný rozdíl je průměrný absolutní rozdíl mezi dvěma položkami náhodně vybranými z populace a relativní průměrný rozdíl je průměrný rozdíl vydělený průměrem, aby se normalizoval podle měřítka.
Giniho index je definován jako poměr ploch na Lorenzově křivce. Je-li plocha mezi přímkou dokonalé rovnosti a Lorenzovou křivkou A a plocha pod Lorenzovou křivkou B, pak Giniho index je A/(A+B). Protože A+B = 0,5, Giniho index G = A/(0,5) = 2A = 1-2B. Je-li Lorenzova křivka znázorněna funkcí Y = L(X), lze hodnotu B zjistit integrací a:
V některých případech lze tuto rovnici použít k výpočtu Giniho koeficientu bez přímého odkazu na Lorenzovu křivku. Například:
Neexistuje výběrová statistika, která by byla obecně nestranným odhadem populačního Giniho koeficientu, jako je relativní střední rozdíl.
Pro některé funkční formy lze Giniho index vypočítat explicitně. Například pokud se y řídí lognormálním rozdělením se směrodatnou odchylkou logů rovnou , pak kde je kumulativní distribuční funkce standardního normálního rozdělení.
Někdy není známa celá Lorenzova křivka a jsou uvedeny pouze hodnoty v určitých intervalech. V takovém případě lze Giniho koeficient aproximovat pomocí různých technik interpolace chybějících hodnot Lorenzovy křivky. Jestliže ( X k, Yk ) jsou známé body na Lorenzově křivce, přičemž X k jsou indexovány ve vzestupném pořadí ( X k – 1 < X k ), takže:
Pokud se Lorenzova křivka aproximuje na každém intervalu jako přímka mezi po sobě jdoucími body, pak lze plochu B aproximovat pomocí lichoběžníků a:
Přesnější výsledky lze získat použitím jiných metod aproximace oblasti B, například aproximací Lorenzovy křivky kvadratickou funkcí přes dvojice intervalů nebo sestavením vhodně hladké aproximace základní distribuční funkce, která odpovídá známým datům. Pokud jsou známy také průměrné a hraniční hodnoty populace pro každý interval, lze je často také použít ke zlepšení přesnosti aproximace.
Giniho koeficient vypočtený ze vzorku je statistický údaj a měla by být uvedena jeho standardní chyba nebo intervaly spolehlivosti pro populační Giniho koeficient. Ty lze vypočítat pomocí bootstrapových technik, ale ty, které byly navrženy, jsou matematicky komplikované a výpočetně náročné i v době rychlých počítačů. Ogwang (2000) tento proces zefektivnil tím, že vytvořil „trikový regresní model“, v němž jsou příjmy ve vzorku seřazeny podle pořadí, přičemž nejnižšímu příjmu je přiřazena hodnost 1. Model pak vyjadřuje pořadí (závislou proměnnou) jako součet konstanty A a normálního chybového členu, jehož rozptyl je nepřímo úměrný yk;
Od té doby se však tvrdí, že to závisí na předpokladech modelu o rozdělení chyb (Ogwang 2004) a nezávislosti chybových členů (Reza & Gastwirth 2006) a že tyto předpoklady často neplatí pro skutečné soubory dat. Proto může být lepší zůstat u metod jackknife, jako jsou metody navržené Yitzhakim (1991) a Karagiannisem a Kovacevicem (2000). Debata pokračuje.
Giniho koeficient lze vypočítat, pokud známe střední hodnotu rozdělení, počet osob (nebo percentilů) a příjem každé osoby (nebo percentil). Princetonský rozvojový ekonom Angus Deaton (1997, 139) zjednodušil výpočet Giniho do jednoho jednoduchého vzorce:
kde u je průměrný příjem populace, Pi je příjmové pořadí P osoby i s příjmem X tak, že nejbohatší osoba dostane pořadí 1 a nejchudší pořadí N. Tím se v příjmovém rozdělení fakticky dává větší váha chudším lidem, což umožňuje, aby Gini splňoval zásadu přenosu.
Obecný index nerovnosti
Giniho koeficient a další standardní indexy nerovnosti se redukují na běžný tvar. Dokonalá rovnost – neexistence nerovnosti – existuje tehdy a pouze tehdy, když se poměr nerovnosti , , rovná 1 pro všechny jednotky j v nějaké populaci; například dokonalá příjmová rovnost existuje tehdy, když se příjem každého rovná průměrnému příjmu , takže pro každého). Míry nerovnosti jsou tedy mírami průměrných odchylek od 1; čím větší je průměrná odchylka, tím větší je nerovnost. Na základě těchto pozorování mají indexy nerovnosti tento společný tvar:
kde pj váží jednotky podle jejich populačního podílu a f(rj) je funkce odchylky rj každé jednotky od 1, bodu rovnosti. Pohled na tento zobecněný index nerovnosti spočívá v tom, že indexy nerovnosti se liší, protože používají různé funkce vzdálenosti poměrů nerovnosti (rj) od 1.
Giniho koeficient rozdělení příjmů
Zatímco vyspělé evropské země a Kanada mají Giniho indexy obvykle mezi 0,24 a 0,36, Giniho indexy Spojených států a Mexika jsou vyšší než 0,40, což znamená, že Spojené státy (podle US Census Bureau) a Mexiko mají větší nerovnost. Použití Giniho indexu může pomoci kvantifikovat rozdíly v politice a filozofii sociálního zabezpečení a odměňování. Je však třeba mít na paměti, že Giniho koeficient může být zavádějící, pokud je používán k politickému srovnávání velkých a malých zemí (viz část věnovaná kritice).
Giniho index pro celý svět se podle různých odhadů pohybuje mezi 0,56 a 0,66. Graf ukazuje hodnoty vyjádřené v procentech v jejich historickém vývoji pro řadu zemí.
Výhody a nevýhody
Výhody Giniho koeficientu jako míry nerovnosti
Hlavní výhodou Giniho koeficientu je, že se jedná o měření nerovnosti pomocí poměrové analýzy. Díky tomu je snadno interpretovatelný a vyhýbá se odkazům na statistický průměr nebo pozici nereprezentující většinu populace, jako je příjem na obyvatele nebo hrubý domácí produkt. Jednoduchost Giniho koeficientu umožňuje jeho snadné použití pro srovnání v různých zemích a také umožňuje porovnávat rozdělení příjmů v různých skupinách i zemích; například Giniho koeficient pro městské oblasti se v mnoha zemích (i když ne ve Spojených státech) liší od koeficientu pro venkovské oblasti. Stejně jako jakákoli jiná míra založená na čase lze Giniho koeficient použít k porovnání rozdělení příjmů v čase, a tak je možné zjistit, zda se nerovnost zvyšuje nebo snižuje nezávisle na absolutních příjmech. Giniho koeficient splňuje čtyři principy, které jsou považovány za důležité:
Nevýhody Giniho koeficientu jako míry nerovnosti
Omezení Giniho indexu spočívají především v jeho relativní povaze: Ztrácí informace o absolutních národních a osobních příjmech. Země mohou mít stejné Giniho koeficienty, ale výrazně se liší v bohatství. V bohaté zemi mohou být základní potřeby rovné (dostupné všem), zatímco v chudé zemi jsou i základní potřeby dostupné nerovnoměrně.
Tím, že měří nerovnost v příjmech, Gini ignoruje rozdílnou efektivitu využití příjmů domácností. Tím, že Gini ignoruje bohatství (kromě toho, že přispívá k příjmům), může vytvářet zdání nerovnosti, pokud se srovnávané osoby nacházejí v různých fázích života. Bohaté země (např. Švédsko) se mohou jevit jako rovnější, ale přitom mají vysoké Giniho koeficienty pro bohatství (např. 77 % hodnoty akcií vlastněných domácnostmi je v držení pouhých 5 % švédských domácností vlastnících akcie)[dead link].
Gini má také některá matematická omezení. Například nelze zprůměrovat různé soubory lidí a získat tak Giniho koeficient všech lidí v těchto souborech: pokud by se Giniho koeficient počítal pro každého člověka, byl by vždy nulový. U velké, ekonomicky různorodé země bude pro zemi jako celek vypočten mnohem vyšší koeficient než pro jednotlivé její regiony. (Koeficient se obvykle aplikuje na měřitelný nominální příjem, nikoli na místní kupní sílu, což má tendenci zvyšovat vypočtený koeficient ve větších oblastech.)
Stejně jako v případě jakéhokoli jiného měřítka rozdělení mohou mít i ekonomiky s podobnými příjmy a Giniho koeficienty velmi rozdílné rozdělení příjmů. To vyplývá z rozdílných tvarů Lorenzovy křivky. Uvažujme například společnost, kde polovina jednotlivců neměla žádný příjem a druhá polovina se o všechny příjmy dělila rovným dílem (tj. jejíž Lorenzova křivka je lineární od (0,0) do (0,5,0) a poté lineární do (1,1)). Jak lze snadno vypočítat, tato společnost má Giniho koeficient 0,5 – stejný jako společnost, v níž se 75 % lidí rovnoměrně dělí o 25 % příjmů, zatímco zbývajících 25 % se rovnoměrně dělí o 75 % (tj. jejíž Lorenzova křivka je lineární od (0,0) do (0,75,0,25) a pak lineární do (1,1)).
Příliš často se uvádí pouze Giniho koeficient, aniž by byly popsány poměry kvantilů použitých pro měření. Stejně jako u jiných koeficientů nerovnosti je Giniho koeficient ovlivněn granularitou měření. Například pět 20% kvantilů (nízká granularita) obvykle poskytne nižší Giniho koeficient než dvacet 5% kvantilů (vysoká granularita) ze stejného rozdělení. S tímto problémem se u měření setkáváme často.
Při používání Giniho koeficientu jako měřítka rovnostářství je třeba postupovat opatrně, protože se jedná o správné měřítko rozptylu příjmů. Pokud například dvě stejně rovnostářské země provádějí rozdílnou imigrační politiku, bude země, která přijímá vyšší podíl nízkopříjmových nebo chudých migrantů, hodnocena jako méně rovnostářská (získá vyšší Giniho koeficient).
Rozšíříme-li význam měření v průběhu života, Giniho koeficient jako bodový odhad rovnosti v určitém čase ignoruje změny v příjmech v průběhu života. Zvýšení podílu mladých nebo starých členů společnosti obvykle způsobí zjevné změny v rovnosti, a to jednoduše proto, že lidé mají v mládí obecně nižší příjmy a bohatství než ve stáří. Z tohoto důvodu mohou faktory, jako je věkové rozložení v rámci populace a mobilita v rámci příjmových tříd, vytvářet zdání rozdílné rovnosti, i když při zohlednění demografických vlivů žádná neexistuje. Daná ekonomika tak může mít v určitém časovém okamžiku vyšší Giniho koeficient ve srovnání s jinou, zatímco Giniho koeficient vypočtený z celoživotních příjmů jednotlivců je ve skutečnosti nižší než zdánlivě rovnější (v daném časovém okamžiku) ekonomika. V podstatě nezáleží jen na nerovnosti v daném roce, ale na složení rozdělení v čase.
Obecné problémy měření
Giniho koeficient se také běžně používá pro měření diskriminační síly ratingových systémů při řízení úvěrového rizika.
Diskriminační schopnost se týká schopnosti modelu úvěrového rizika rozlišovat mezi klienty v selhání a klienty, kteří v selhání nejsou. Výše uvedený vzorec lze použít pro konečný model a také na úrovni jednotlivých faktorů modelu ke kvantifikaci diskriminační síly jednotlivých faktorů. To je důsledkem toho, že příliš mnoho klientů, kteří neplní své závazky, spadá do nižší bodové škály, např. faktor má desetibodovou stupnici a 30 % klientů, kteří neplní své závazky, jsou přiřazeny nejnižší dostupné body, např. 0 nebo záporné body. To naznačuje, že se faktor chová neintuitivně a vyžadovalo by to další zkoumání ve fázi vývoje modelu.
Ačkoli je Giniho koeficient nejpopulárnější v ekonomii, lze jej teoreticky použít v jakémkoli vědním oboru, který studuje rozdělení. Například v ekologii se Giniho koeficient používá jako měřítko biodiverzity, kdy se kumulativní podíl druhů vynese do grafu proti kumulativnímu podílu jedinců. Ve zdravotnictví se používá jako měřítko nerovnosti kvality života v populaci v souvislosti se zdravím. Ve vzdělávání se používá jako míra nerovnosti vysokých škol. V chemii se používá k vyjádření selektivity inhibitorů proteinkináz vůči panelu kináz. V inženýrství se používá k hodnocení spravedlnosti, které dosahují internetové směrovače při plánování přenosů paketů z různých toků provozu. Ve statistice při sestavování rozhodovacích stromů se používá k měření čistoty možných podřízených uzlů s cílem maximalizovat průměrnou čistotu dvou podřízených uzlů při rozdělení a byl porovnáván s jinými mírami rovnosti.