Exponenciální vyhlazování

Ve statistice se exponenciálním vyhlazováním rozumí určitý typ techniky pohyblivého průměru aplikované na data časových řad, a to buď za účelem tvorby vyhlazených dat pro prezentaci, nebo pro tvorbu prognóz. Samotná data časových řad jsou sledem pozorování. Pozorovaný jev může být v podstatě náhodný proces, nebo to může být uspořádaný, ale hlučný proces.

Exponenciální vyhlazování je běžně aplikováno na finanční trh a ekonomická data, ale může být použito s jakoukoliv diskrétní sadou opakovaných měření. Pořadí nezpracovaných dat je často reprezentováno {xt}, a výstup algoritmu exponenciálního vyhlazování je běžně psán jako {st}, což může být považováno za náš nejlepší odhad toho, jaká bude další hodnota x. Když sled pozorování začíná v čase t = 0, nejjednodušší forma exponenciálního vyhlazování je dána vzorci

kde α je vyhlazovací faktor a 0 < α < 1.

Intuitivně nejjednodušším způsobem vyhlazení časové řady je výpočet jednoduchého nebo neváženého klouzavého průměru. Vyhlazený statistický st je pak jen průměr posledních k pozorování:

kde volba celého čísla k >1 je libovolná. Malá hodnota k bude mít menší vyhlazovací efekt a bude více reagovat na nedávné změny v datech, zatímco větší k bude mít větší vyhlazovací efekt a bude mít výraznější prodlevu v vyhlazené posloupnosti. Jednou z nevýhod této techniky je, že ji nelze použít na první výrazy k −1 časové řady.

Vážený klouzavý průměr

Trochu složitější metoda pro vyhlazení časové řady {xt} je vypočítat vážený klouzavý průměr prvním výběrem sady váhových faktorů

a pak pomocí těchto vah vypočítat vyhlazené statistiky {st}:

V praxi se váhové faktory často volí tak, aby dávaly větší váhu nejnovějším pojmům v časové řadě a menší váhu starším údajům. Všimněte si, že tato technika má stejnou nevýhodu jako jednoduchá technika klouzavého průměru (tj. nelze ji použít, dokud nejsou provedena alespoň k pozorování) a že s sebou nese složitější výpočet v každém kroku vyhlazovacího postupu.

Exponenciální klouzavý průměr

Nejjednodušší forma exponenciálního vyhlazování je dána vzorci

kde α je vyhlazovací faktor a 0 < α < 1. Jinými slovy, vyhlazený statistický st je jednoduchý vážený průměr nejnovějšího pozorovacího xt a předchozího vyhlazeného statistického st−1. Jednoduché exponenciální vyhlazování se snadno aplikuje, a jakmile jsou k dispozici dvě pozorování, vznikne vyhlazená statistika.

Hodnoty α blízké jednotě mají menší vyhlazující účinek a dávají větší váhu nedávným změnám v datech, zatímco hodnoty α blíže k nule mají větší vyhlazující účinek a méně reagují na nedávné změny. Neexistuje žádný formálně správný postup pro volbu α. Někdy se pro volbu vhodného faktoru používá úsudek statistika. Alternativně lze pro optimalizaci hodnoty α použít statistickou techniku. Například metodu nejmenších čtverců lze použít pro určení hodnoty α, pro kterou je součet veličin (sn-1 − xn)2 minimalizován.

Tato jednoduchá forma exponenciálního vyhlazování je také známá jako „Brownovo exponenciální vyhlazování“ a jako „exponenciálně vážený klouzavý průměr“. Technicky ji lze také klasifikovat jako model ARIMA(0,1,1) bez konstantního výrazu.*

Přímým nahrazením definiční rovnice pro jednoduché exponenciální vyhlazení zpět do sebe zjistíme, že

Jinými slovy, jak čas plyne, vyhlazený statistický st se stává váženým průměrem většího a většího počtu minulých pozorování xt−n a váhy přiřazené předchozím pozorováním jsou obecně úměrné výrazům geometrické posloupnosti {1, (1−α), (1−α)2, (1−α)3, …}. Geometrická posloupnost je diskrétní verze exponenciální funkce, takže tak tato metoda vyhlazování dostala svůj název.