Heteroskedasticita – Dobrá psychoterapie

Vykreslete s náhodnými daty ukazujícími heteroskedasticitu.

Ve statistice je sekvence nebo vektor náhodných veličin heteroskedastický, nebo heteroscedastický, pokud náhodné veličiny mají různé rozptyly. Komplementární koncept se nazývá homoskedasticita. Termín znamená „rozdílný rozptyl“ a pochází z řeckého „hetero“ („rozdílný“) a „skedasis“ („rozptyl“).

Při použití některých statistických technik, například obyčejných nejmenších čtverců (OLS), je obvykle vytvořena řada předpokladů. Jedním z nich je, že chybový výraz má konstantní rozptyl. To bude platit, pokud se předpokládá, že pozorování chybového výrazu jsou odvozena z identických distribucí. Heteroskedasticita je porušením tohoto předpokladu.

Například chybový termín se může měnit nebo zvětšovat s každým pozorováním, což je často případ měření průřezů nebo časových řad. Heteroskedasticita je často studována jako součást ekonometrie, která se často zabývá údaji, které ji vykazují.

S příchodem robustních standardních chyb umožňujících dedukci bez upřesnění podmíněného druhého momentu chybového výrazu není testování podmíněné homoskedasticity tak důležité jako v minulosti.[Jak odkazovat a odkaz na shrnutí nebo text]

Eknometr Robert Engle získal v roce 2003 Nobelovu cenu za ekonomii za své studie o regresní analýze v přítomnosti heteroskedasticity, které vedly k jeho formulaci metody modelování ARCH (AutoRegressive Conditional Heteroscedasticity).

Heteroskedasticita nezpůsobuje zkreslení odhadů OLS koeficientů. Nicméně rozptyl (a tedy standardní chyby) koeficientů bývá podceňován, nafukuje t-skóre a někdy se zdá, že nevýznamné proměnné jsou statisticky významné.

Heteroskedasticita je také hlavní praktickou otázkou, se kterou se setkáváme při problémech s ANOVA.
F test lze za určitých okolností stále použít.

Existuje několik metod testování na přítomnost heteroskedasticity:

Tyto poslední dva testy fungují pro nestandardně distribuované datové soubory

Existují tři běžné korekce heteroskedasticity:

K heteroskedastice často dochází, když je velký rozdíl mezi velikostmi pozorování.

Většina učebnic statistiky bude obsahovat alespoň nějaký materiál o heteroskedasticitě. Některé příklady jsou:

Průměr (Aritmetika, Geometrie) – Medián – Režim – Výkon – Odchylka – Směrodatná odchylka

Testování hypotéz – Význam – Nullova hypotéza/Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu

Funkce přežití – Kaplan-Meier – Logrank test – Četnost selhání – Proporcionální modely nebezpečnosti

Normal (zvonová křivka) – Poisson – Bernoulli

Matoucí veličina – Pearsonův korelační koeficient produktového momentu – Rank korelace (Spearmanův korelační koeficient hodnosti, Kendall tau korelační koeficient hodnosti)

Lineární regrese – Nelineární regrese – Logistická regrese