Vykreslete s náhodnými daty ukazujícími heteroskedasticitu.
Ve statistice je sekvence nebo vektor náhodných veličin heteroskedastický, nebo heteroscedastický, pokud náhodné veličiny mají různé rozptyly. Komplementární koncept se nazývá homoskedasticita. Termín znamená „rozdílný rozptyl“ a pochází z řeckého „hetero“ („rozdílný“) a „skedasis“ („rozptyl“).
Při použití některých statistických technik, například obyčejných nejmenších čtverců (OLS), je obvykle vytvořena řada předpokladů. Jedním z nich je, že chybový výraz má konstantní rozptyl. To bude platit, pokud se předpokládá, že pozorování chybového výrazu jsou odvozena z identických distribucí. Heteroskedasticita je porušením tohoto předpokladu.
Například chybový termín se může měnit nebo zvětšovat s každým pozorováním, což je často případ měření průřezů nebo časových řad. Heteroskedasticita je často studována jako součást ekonometrie, která se často zabývá údaji, které ji vykazují.
S příchodem robustních standardních chyb umožňujících dedukci bez upřesnění podmíněného druhého momentu chybového výrazu není testování podmíněné homoskedasticity tak důležité jako v minulosti.[Jak odkazovat a odkaz na shrnutí nebo text]
Eknometr Robert Engle získal v roce 2003 Nobelovu cenu za ekonomii za své studie o regresní analýze v přítomnosti heteroskedasticity, které vedly k jeho formulaci metody modelování ARCH (AutoRegressive Conditional Heteroscedasticity).
Heteroskedasticita nezpůsobuje zkreslení odhadů OLS koeficientů. Nicméně rozptyl (a tedy standardní chyby) koeficientů bývá podceňován, nafukuje t-skóre a někdy se zdá, že nevýznamné proměnné jsou statisticky významné.
Heteroskedasticita je také hlavní praktickou otázkou, se kterou se setkáváme při problémech s ANOVA.
F test lze za určitých okolností stále použít.
Existuje několik metod testování na přítomnost heteroskedasticity:
Tyto poslední dva testy fungují pro nestandardně distribuované datové soubory
Existují tři běžné korekce heteroskedasticity:
K heteroskedastice často dochází, když je velký rozdíl mezi velikostmi pozorování.
Většina učebnic statistiky bude obsahovat alespoň nějaký materiál o heteroskedasticitě. Některé příklady jsou:
Průměr (Aritmetika, Geometrie) – Medián – Režim – Výkon – Odchylka – Směrodatná odchylka
Testování hypotéz – Význam – Nullova hypotéza/Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu
Funkce přežití – Kaplan-Meier – Logrank test – Četnost selhání – Proporcionální modely nebezpečnosti
Normal (zvonová křivka) – Poisson – Bernoulli
Matoucí veličina – Pearsonův korelační koeficient produktového momentu – Rank korelace (Spearmanův korelační koeficient hodnosti, Kendall tau korelační koeficient hodnosti)
Lineární regrese – Nelineární regrese – Logistická regrese