Extrapolace

Ve statistice je extrapolace proces konstrukce nových datových bodů mimo diskrétní množinu známých datových bodů. Je podobná procesu interpolace, který konstruuje nové body mezi známými body, ale jeho výsledky jsou často méně smysluplné a podléhají větší nejistotě.

To znamená vytvořit tečnu na konci známých dat a rozšířit ji za tuto mez. Lineární extrapolace poskytne dobré výsledky pouze tehdy, pokud se použije k rozšíření grafu přibližně lineární funkce. Lineární extrapolaci lze snadno provést pomocí pravítka na psaném grafu nebo pomocí počítače. Příkladem je trendová čára.

Kuželosečka může být vytvořena pomocí pěti bodů na konci známých dat. Pokud je vytvořená kuželosečka elipsa nebo kruh, zakřiví se zpět na sebe. Parabolická nebo hyperbolická křivka se zakřivit nebude, ale může se zakřivit zpět vzhledem k ose X. Tento typ extrapolace by mohl být proveden pomocí šablony kuželoseček na psaném grafu nebo s počítačem.

Polynomiální křivka může být vytvořena prostřednictvím celých známých dat nebo těsně před jejich koncem. Výsledná křivka pak může být rozšířena za konec známých dat. Polynomiální extrapolace se obvykle provádí pomocí Lagrangeovy interpolace nebo pomocí Newtonovy metody konečných rozdílů k vytvoření Newtonovy řady, která odpovídá datům. Výsledný polynom může být použit k extrapolaci dat.

Kvalita určité metody extrapolace je obvykle omezena předpoklady o funkci dané metodou. Pokud metoda předpokládá, že data jsou hladká, pak se špatně extrapoluje funkce, která hladká není.

I pro správné předpoklady o funkci se extrapolace může exponenciálně odchýlit od funkce. Klasickým příkladem jsou zkrácené reprezentace mocninné řady sin(x) a souvisejících trigonometrických funkcí. Vezmeme-li například pouze data z blízkosti x = 0, můžeme odhadnout, že funkce se chová jako sin(x) ~ x. V okolí x = 0 je to výborný odhad. Mimo x = 0 se však extrapolace libovolně vzdaluje od osy x, zatímco sin(x) zůstává v intervalu [−1,1]. Tj. chyba se zvyšuje bez vazby.

Doporučujeme:  Ušní trénink

Vezmeme-li více výrazů v mocninných řadách sin(x) kolem x = 0, vznikne lepší shoda nad větším intervalem poblíž x = 0, ale stále vzniknou extrapolace, které se odchýlí od osy x.

Tato divergence je specifickou vlastností extrapolačních metod a je obcházena pouze tehdy, když funkční formy převzaté extrapolační metodou (neúmyslně nebo úmyslně kvůli dodatečným informacím) přesně reprezentují povahu extrapolované funkce. Pro konkrétní problémy mohou být tyto dodatečné informace k dispozici, ale v obecném případě není možné uspokojit všechny možné funkční chování s prakticky malou množinou potenciálních chování.

Míra přesnosti extrapolace je známá jako „interval spolehlivosti predikce“ a je obvykle vyjádřena jako horní a dolní hranice, v rámci které se očekává přesnost predikce v 19 případech z 20 (95% interval spolehlivosti).

Příklady extrapolační chyby

Spolehlivost extrapolace je indikována jejím intervalem spolehlivosti predikce, který se často odchyluje k nemožným hodnotám. Extrapolace mimo tento rozsah může vést k zavádějícím výsledkům.

Například úmrtnost na nové onemocnění se může brzy dramaticky zvýšit. Pokud se pak graf úmrtnosti extrapoluje lineárně, mohlo by se zdát, že celá lidská populace zemře na toto onemocnění v krátkém počtu let. Ve skutečnosti může úmrtnost na nově objevené onemocnění klesnout, protože náchylní zemřou a zbytek změní své chování, aby se vyhnul nákaze. Ti, kteří zůstanou, mohou mít také přirozenou imunitu na toto onemocnění nebo získanou imunitu v důsledku expozice. Může se také vyvinout lékařská léčba ovlivňující šíření a úmrtnost na toto onemocnění. Jednoduchá lineární extrapolace předpokládá, že existuje nekonečná populace, a pokud tento trend roste rychleji než populace, bude předpovídat, že zemře více lidí, než jich kdy bylo naživu.

Obdobně platí, že pokud se množství vody v jezeře v čase snižuje, lineární extrapolace předpoví, že krátce poté, co voda zmizí, dojde k zápornému množství vody. To je absurdní výsledek, který naznačuje, že extrapolace se provádí ve špatné doméně.

Doporučujeme:  Havraní paradox

Extrapolace v komplexní rovině

V komplexní analýze může být problém extrapolace převeden na interpolační problém změnou proměnné z − 1/z. Tato transformace vymění část komplexní roviny uvnitř jednotkové kružnice za část komplexní roviny mimo jednotkovou kružnici. Zejména je kompaktifikační bod v nekonečnu mapován na počátek a naopak. U této transformace je však třeba dbát opatrnosti, protože původní funkce mohla mít v nekonečnu „rysy“, například póly a další singularity, které nebyly patrné ze vzorkovaných dat.

Další problém extrapolace volně souvisí s problémem analytického pokračování, kdy je (typicky) reprezentace mocninné řady funkce rozšířena v jednom z jejích bodů konvergence tak, aby vznikla mocninná řada s větším poloměrem konvergence. V podstatě se k extrapolaci funkce na větší oblast používá soubor dat z malé oblasti.

Analytické pokračování může být opět zmařeno funkcemi, které nebyly patrné z počátečních dat.

Také lze použít sekvenční transformace jako Padého aproximanty a Levinovy typy sekvenčních transformací jako extrapolační metody, které vedou k sumaci mocninných řad, které jsou divergentní mimo původní poloměr konvergence. V tomto případě člověk často získá
racionální aproximanty.