Datové modelování

Datové modelování je v informatice proces strukturování a organizování dat, typicky pomocí systému správy databází.

Správa velkého množství strukturovaných a nestrukturovaných dat je primární funkcí informačních systémů. Datové modely popisují strukturovaná data pro uložení v systémech správy dat, jako jsou relační databáze. Obvykle nepopisují nestrukturovaná data, jako jsou textové dokumenty, e-mailové zprávy, obrázky, digitální zvuk a video. Rané fáze mnoha softwarových vývojových projektů kladou důraz na návrh konceptuálního datového modelu. Takový návrh může být podrobně zpracován do logického datového modelu. V pozdějších fázích může být tento model převeden do fyzického datového modelu.

Termín datový model ve skutečnosti odkazuje na dvě velmi odlišné věci: popis datové struktury a způsob, jakým jsou data organizována například pomocí systému správy databází.

Datový model popisuje strukturu dat v rámci dané domény a implicitně i základní strukturu této domény samotné. Datový model tak může představovat třídy subjektů, o nichž si společnost přeje mít informace, atributy těchto informací a vztahy mezi těmito subjekty. Model popisuje organizaci bez ohledu na to, jak mohou být data zastoupena v počítačovém systému.

Subjekty reprezentované datovým modelem mohou být hmotnými entitami, ale modely, které takové třídy konkrétních entit zahrnují, se v průběhu času mění. Robustní datové modely často identifikují abstrakce takových entit. Datový model může například zahrnovat třídu entit nazvanou „Osoba“, reprezentující všechny osoby, které s organizací spolupracují. Taková třída abstraktních entit je typicky vhodnější než ty nazývané „Prodejce“ nebo „Zaměstnanec“, které identifikují konkrétní role, které tyto osoby hrají.

Správný koncepční datový model popisuje sémantiku organizace. Jedná se o soubor tvrzení o povaze organizace. Řádné třídy entit jsou pojmenovány slovy přirozeného jazyka místo odborného žargonu. Stejně tak správně pojmenované vztahy tvoří konkrétní tvrzení o organizaci. Například vztah nazvaný „je složen z“ působící na třídy entit „Řádek“ a „Řádková položka“ tvoří konkrétní tvrzení „Každá objednávka je složena z jedné nebo více Řádkových položek“.

Doporučujeme:  7 důvodů, proč ubližujeme těm, které milujeme

Jiný druh datového modelu popisuje, jak uspořádat data pomocí systému pro správu databází nebo jiné technologie pro správu dat. Popisuje například relační tabulky a sloupce nebo objektově orientované třídy a atributy. Takový datový model je někdy označován jako fyzický datový model, ale v původní architektuře tří schémat ANSI je označován jako „logický“. V této architektuře fyzický model popisuje paměťová média (válce, stopy a tabulkové plochy). V ideálním případě je tento model odvozen z výše popsaného konceptuálnějšího datového modelu. Může se však lišit, aby zohledňoval omezení, jako je kapacita zpracování a vzorce využití.

Analýza dat je sice běžný termín pro modelování dat, ale ve skutečnosti má tato činnost více společného s myšlenkami a metodami syntézy (odvozování obecných pojmů z konkrétních instancí) než s analýzou (identifikace komponentních pojmů z obecnějších). {Pravděpodobně si říkáme systémoví analytici, protože nikdo neumí říci systémoví syntetizátoři.} Datové modelování se snaží spojit zájmové datové struktury do soudržného, neoddělitelného celku tím, že odstraňuje zbytečné nadbytečnosti dat a spojuje datové struktury se vztahy.

Jiný přístup je pomocí adaptivních systémů, jako jsou umělé neuronové sítě, které mohou autonomně vytvářet implicitní modely dat.

Pro návrh datových modelů bylo vyvinuto několik technik. Zatímco tyto metodiky jsou vodítkem pro datové modeláře při jejich práci, dva různí lidé používající stejnou metodiku často přijdou s velmi odlišnými výsledky. Nejvýznamnější jsou: