Matematický model je abstraktní model, který k popisu systému používá matematický jazyk. Matematické modely se používají zejména v přírodních vědách a technických oborech (jako je fyzika, biologie a elektrotechnika), ale také ve společenských vědách (jako je matematická psychologie, ekonomie, sociologie a politologie); matematické modely používají nejrozšířeněji fyzici, inženýři, kognitivní vědci, informatici a ekonomové.
Eykhoff (1974) definoval matematický model jako ‚reprezentaci základních aspektů existujícího systému (nebo systému, který má být konstruován), který prezentuje znalost tohoto systému v použitelné formě‘.
Příklady matematických modelů
Když inženýři analyzují systém, který má být ovládán nebo optimalizován, často používají matematický model. V analýze mohou inženýři sestavit popisný model systému jako hypotézu, jak by systém mohl fungovat, nebo se pokusit odhadnout, jak by nepředvídatelná událost mohla ovlivnit systém. Podobně při ovládání systému mohou inženýři vyzkoušet různé řídící přístupy v simulacích.
Matematický model obvykle popisuje systém pomocí množiny proměnných a množiny rovnic, které vytvářejí vztahy mezi proměnnými.
Hodnoty proměnných mohou být prakticky cokoliv; například reálná nebo celočíselná čísla, booleovské hodnoty nebo řetězce.
Proměnné reprezentují některé vlastnosti systému, například měřené systémové výstupy často ve formě signálů, časových dat, čítačů, výskytu událostí (ano/ne).
Skutečný model je množina funkcí, které popisují vztahy mezi různými proměnnými.
Rozhodovací proměnné jsou někdy známy jako nezávislé proměnné. Exogenní proměnné jsou někdy známy jako parametry nebo konstanty.
Proměnné nejsou na sobě nezávislé, protože stavové proměnné jsou závislé na rozhodovacích, vstupních, náhodných a exogenních proměnných. Dále jsou výstupní proměnné závislé na stavu systému (reprezentovaném stavovými proměnnými).
Cíle a omezení systému a jeho uživatelů mohou být reprezentovány jako funkce výstupních proměnných nebo stavových proměnných. Objektivní funkce budou záviset na úhlu pohledu uživatele modelu. V závislosti na kontextu je objektivní funkce známa také jako index výkonnosti, protože je to určité měřítko zájmu uživatele. Ačkoli neexistuje žádné omezení počtu objektivních funkcí a omezení, které model může mít, používání nebo optimalizace modelu se více zapojuje (výpočetně).
Klasifikace matematických modelů
Mnoho matematických modelů lze klasifikovat některými z následujících způsobů:
Matematické modelovací problémy jsou často klasifikovány do modelů černých nebo bílých skříněk podle toho, kolik a priori informací je ze systému k dispozici. Model černých skříněk je systém, o kterém nejsou a priori k dispozici žádné informace. Model bílých skříněk (také nazývaný skleněná skříňka nebo čirá skříňka) je systém, kde jsou k dispozici všechny potřebné informace. Prakticky všechny systémy jsou někde mezi modely černých a bílých skříněk, takže tento koncept funguje pouze jako intuitivní vodítko pro přístup.
Obvykle je vhodnější použít co nejvíce a priori informací, aby byl model přesnější. Proto jsou modely s bílými skříňkami obvykle považovány za jednodušší, protože pokud jste použili informace správně, pak se model bude chovat správně. Často se informace a priori objevují ve formě znalosti typu funkcí vztahujících se k různým proměnným. Pokud například vytvoříme model toho, jak lék funguje v lidském systému, víme, že obvykle je množství léku v krvi exponenciálně se rozkládající funkcí. Stále nám však zůstává několik neznámých parametrů: jak rychle se množství léku rozkládá a jaké je počáteční množství léku v krvi? Tento příklad proto není zcela modelem s bílými skříňkami. Tyto parametry musí být nějakým způsobem odhadnuty, než je možné model použít.
V modelech černých skříněk se člověk snaží odhadnout jak funkční podobu vztahů mezi proměnnými, tak číselné parametry v těchto funkcích. Použitím apriorních informací bychom mohli skončit například u souboru funkcí, které by pravděpodobně dokázaly adekvátně popsat systém. Pokud nejsou apriorní informace, snažili bychom se používat funkce co nejobecnější, abychom pokryli všechny různé modely. Často používaný přístup pro modely černých skříněk jsou neuronové sítě, které obvykle nepředpokládají téměř nic o příchozích datech. Problém s použitím velké sady funkcí k popisu systému je, že odhadování parametrů je stále obtížnější, když se množství parametrů (a různých typů funkcí) zvyšuje.
Někdy je užitečné začlenit subjektivní informaci do matematického modelu. To lze provést na základě intuice, zkušenosti nebo odborného názoru, nebo na základě pohodlnosti matematické formy. Bayesovská statistika poskytuje teoretický rámec pro začlenění takové subjektivity do přísné analýzy: člověk určí předchozí rozdělení pravděpodobnosti (které může být subjektivní) a pak toto rozdělení aktualizuje na základě empirických dat. Příkladem toho, kdy by takový přístup byl nutný, je situace, kdy experimentátor lehce ohne minci a jednou jí hodí, zaznamená, zda padne panna, a pak dostane za úkol předpovědět pravděpodobnost, že příští hod padne panna. Po ohnutí mince je skutečná pravděpodobnost, že mince padne panna, neznámá, takže experimentátor by musel učinit svévolné rozhodnutí (třeba pohledem na tvar mince) o tom, jaké předchozí rozdělení použít. Zahrnutí subjektivní informace je v tomto případě nezbytné k získání přesné předpovědi pravděpodobnosti, protože jinak by člověk odhadl 1 nebo 0 jako pravděpodobnost, že další hod padne panna, což by bylo téměř jistě špatně.
Obecně platí, že složitost modelu zahrnuje kompromis mezi jednoduchostí a přesností modelu. Occamova břitva je princip zvláště důležitý pro modelování; základní myšlenkou je, že mezi modely se zhruba stejnou prediktivní silou je nejžádanější ten nejjednodušší. Zatímco přidaná složitost obvykle zlepšuje vhodnost modelu, může ztížit jeho pochopení a práci s ním a může také způsobit výpočetní problémy, včetně Numerické nestability. Thomas Kuhn tvrdí, že jak věda postupuje, vysvětlení mají tendenci být složitější, než posun Paradigmu nabídne radikální zjednodušení.
Například při modelování letu letadla bychom mohli do našeho modelu zabudovat každou mechanickou část letadla a získali bychom tak téměř model systému s bílými skříňkami. Výpočetní náklady na přidání tak obrovského množství detailů by však použití takového modelu v podstatě znemožnily. Navíc by se zvýšila nejistota kvůli příliš složitému systému, protože každá samostatná část vyvolává určitou míru rozptylu v modelu. Proto je obvykle vhodné provést nějaké aproximace, aby se model zmenšil na rozumnou velikost. Inženýři často mohou přijmout nějaké aproximace, aby získali robustnější a jednodušší model. Například Newtonova klasická mechanika je přibližným modelem reálného světa. Newtonův model je přesto zcela dostačující pro většinu situací v běžném životě, tedy pokud jsou rychlosti částic hluboko pod rychlostí světla, a studujeme pouze makročástice.
Každý model, který není čistě white-box, obsahuje některé parametry, které lze použít pro přizpůsobení modelu systému, který popisuje. Pokud je modelování prováděno neuronovou sítí, nazývá se optimalizace parametrů tréninkem. V konvenčnějším modelování pomocí explicitně zadaných matematických funkcí jsou parametry určeny tvarováním křivky.
Rozhodující součástí procesu modelování je vyhodnocení, zda daný matematický model popisuje systém přesně, či nikoli. Na tuto otázku může být obtížné odpovědět, protože zahrnuje několik různých typů hodnocení.
Nejjednodušší částí vyhodnocení modelu je obvykle kontrola, zda model vyhovuje experimentálním měřením nebo jiným empirickým údajům. V modelech s parametry je běžným přístupem k testování tohoto vyhovování rozdělení dat do dvou nesouvislých podskupin: tréninková data a ověřovací data. Tréninková data se používají k odhadu parametrů modelu. Přesný model bude úzce odpovídat ověřovacím datům, i když tato data nebyla použita k nastavení parametrů modelu. Tato praxe je ve statistikách označována jako křížová validace.
Definování metriky pro měření vzdáleností mezi pozorovanými a predikovanými daty je užitečným nástrojem pro posouzení vhodnosti modelu. Ve statistice, teorii rozhodování a některých ekonomických modelech hraje ztrátová funkce podobnou roli.
I když je poměrně jednoduché otestovat vhodnost parametrů, může být obtížnější otestovat platnost obecné matematické formy modelu. Obecně bylo vyvinuto více matematických nástrojů pro otestování vhodnosti statistických modelů než modelů zahrnujících diferenciální rovnice. Nástroje z neparametrické statistiky mohou být někdy použity pro vyhodnocení, jak dobře data odpovídají známému rozdělení nebo pro vytvoření obecného modelu, který vytváří pouze minimální předpoklady o matematické formě modelu.
Posuzování rozsahu modelu, tedy určení, na jaké situace je model použitelný, může být méně jednoduché. Pokud byl model sestaven na základě souboru dat, je třeba určit, pro jaké systémy nebo situace jsou data typickým souborem dat.
Otázka, zda model dobře popisuje vlastnosti systému mezi datovými body, se nazývá interpolace a stejná otázka pro události nebo datové body mimo pozorovaná data se nazývá extrapolace.
Jako příklad typických omezení rozsahu modelu můžeme při hodnocení newtonovské klasické mechaniky uvést, že Newton prováděl svá měření bez pokročilého vybavení, takže nemohl měřit vlastnosti částic pohybujících se rychlostí blízkou rychlosti světla. Stejně tak neměřil pohyby molekul a jiných malých částic, ale pouze makročástic. Není pak divu, že jeho model není dobře extrapolován do těchto oblastí, i když jeho model je pro běžnou životní fyziku zcela dostačující.
Filosofické úvahy
Mnoho typů modelování implicitně zahrnuje tvrzení o kauzalitě. To obvykle (ale ne vždy) platí o modelech zahrnujících diferenciální rovnice. Protože účelem modelování je zvýšit naše chápání světa, spočívá platnost modelu nejen na jeho vhodnosti k empirickým pozorováním, ale také na jeho schopnosti extrapolovat do situací nebo dat nad rámec těch, které byly v modelu původně popsány. Lze tvrdit, že model je bezcenný, pokud neposkytuje nějaký vhled, který jde nad rámec toho, co je již známo z přímého zkoumání zkoumaného jevu.
Příkladem takové kritiky je argument, že matematické modely teorie Optimálního vyhledávání potravy nenabízejí vhled, který by přesahoval závěry evoluce založené na zdravém rozumu a dalších základních principech ekologie.