Datová vizualizace Wikipedie jako součásti World Wide Webu, demonstrující hypertextové odkazy
Datová vizualizace nebo datová vizualizace je tvorba a studium vizuální reprezentace dat, což znamená „informace, která byla abstrahována v nějaké schematické formě, včetně atributů nebo proměnných pro jednotky informací“.
Vizualizace dat ze sociálních médií
Podle Friedmana (2008) je „hlavním cílem vizualizace dat sdělovat informace jasně a efektivně pomocí grafických prostředků. Neznamená to, že vizualizace dat musí vypadat nudně, aby byla funkční, nebo extrémně sofistikovaně, aby vypadala krásně. Pro efektivní zprostředkování myšlenek musí jít estetická forma i funkčnost ruku v ruce a poskytovat vhled do poměrně řídké a složité datové sady sdělováním jejích klíčových aspektů intuitivnějším způsobem. Přesto designéři často nedokážou dosáhnout rovnováhy mezi formou a funkcí a vytvářejí nádherné vizualizace dat, které neslouží svému hlavnímu účelu – sdělovat informace“.
Fernanda Viegasová a Martin M. Wattenberg dokonce naznačili, že ideální vizualizace by měla nejen jasně komunikovat, ale také stimulovat diváckou angažovanost a pozornost.
Vizualizace dat úzce souvisí s informační grafikou, vizualizací informací, vědeckou vizualizací a statistickou grafikou. V novém tisíciletí se vizualizace dat stala aktivní oblastí výzkumu, výuky a vývoje. Podle Post et al. (2002) sjednotila vědeckou a informační vizualizaci. Brian Willison prokázal, že vizualizace dat byla také spojena se zlepšením agilního vývoje softwaru a se zapojením zákazníků.
Knihovna KPI vyvinula „Periodickou tabulku vizualizačních metod“, interaktivní graf zobrazující různé metody vizualizace dat. Zahrnuje šest typů metod vizualizace dat: data, informace, koncept, strategie, metafora a sloučenina.
Existují různé přístupy k rozsahu vizualizace dat. Jedno společné zaměření je na prezentaci informací, jak ji prezentoval Friedman (2008). Tímto způsobem Friendly (2008) předpokládá dvě hlavní části vizualizace dat: statistickou grafiku a tematickou kartografii. V tomto řádku uvádí článek „Data Visualization: Modern Approaches“ (2007) přehled sedmi témat vizualizace dat:
Všechny tyto předměty úzce souvisejí s grafickým designem a informační reprezentací.
Na druhou stranu, z pohledu informatiky, Frits H. Post (2002) rozdělil obor do několika dílčích oborů:
Různé typy vizualizací a jejich propojení s infografikou naleznete v infografice.
Získávání dat je vzorkování reálného světa za účelem generování dat, se kterými může počítač manipulovat. Někdy zkráceně DAQ nebo DAS, získávání dat obvykle zahrnuje získávání signálů a průběhů a zpracování signálů za účelem získání požadovaných informací. Součásti systémů pro získávání dat zahrnují vhodné senzory, které převádějí jakýkoli parametr měření na elektrický signál, který je získáván hardwarem pro získávání dat.
Analýza dat je proces studia a sumarizace dat se záměrem získat užitečné informace a vypracovat závěry. Analýza dat úzce souvisí s vytěžováním dat, ale vytěžování dat se obvykle zaměřuje na větší soubory dat s menším důrazem na vyvozování závěrů a často používá data, která byla původně shromážděna pro jiný účel. Ve statistických aplikacích někteří lidé dělí analýzu dat na popisnou statistiku, průzkumnou analýzu dat a inferentiální statistiku (nebo konfirmační analýzu dat), kde se EDA zaměřuje na objevování nových vlastností v datech a CDA na potvrzování nebo falšování existujících hypotéz.
Typy analýzy dat jsou:
Správa dat zahrnuje lidi, procesy a technologie potřebné k vytvoření konzistentního, podnikového pohledu na data organizace s cílem:
Vytěžování dat je proces třídění velkého množství dat a vybírání relevantních informací. Obvykle ho používají organizace business intelligence a finanční analytici, ale stále více se používá ve vědách k získávání informací z obrovských souborů dat generovaných moderními experimentálními a pozorovacími metodami.
Transformace dat je proces automatizace a transformace, jak dat v reálném čase, tak dat offline z jednoho formátu do druhého. Existují standardy a protokoly, které poskytují specifikace a pravidla, a obvykle k tomu dochází v procesu agregace nebo konsolidace nebo interoperability. Primární případy použití jsou v organizacích integračních systémů a osobách compliance.
Software pro vizualizaci dat
Architektura prezentace dat
Architektura prezentace dat (DPA) je soubor dovedností, který se snaží identifikovat, lokalizovat, manipulovat, formátovat a prezentovat data tak, aby optimálně sdělovala smysl a nabízela znalosti.
Termín architektura datové prezentace je historicky přisuzován Kelly Lauttové: „Architektura datové prezentace (DPA) je zřídka aplikovaná sada dovedností kritická pro úspěch a hodnotu Business Intelligence. Architektura datové prezentace spojuje vědu o číslech, datech a statistikách v objevování cenných informací z dat a jejich používání, relevantnosti a akceschopnosti s uměním vizualizace dat, komunikace, organizační psychologie a řízení změn s cílem poskytovat řešení business intelligence s rozsahem dat, načasováním dodávek, formátem a vizualizacemi, které budou nejefektivněji podporovat a řídit provozní, taktické a strategické chování směrem k pochopeným obchodním (nebo organizačním) cílům. DPA není ani IT, ani sada obchodních dovedností, ale existuje jako samostatná oblast odbornosti. Architektura prezentace dat je často zaměňována s vizualizací dat, což je mnohem širší soubor dovedností, který zahrnuje určení toho, jaká data v jakém harmonogramu a v jakém přesném formátu mají být prezentována, nejen nejlepší způsob prezentace dat, která již byla vybrána (což je vizualizace dat). Schopnosti vizualizace dat jsou jedním z prvků DPA.“
S ohledem na výše uvedené cíle se vlastní práce na architektuře prezentace dat skládá z:
Práce DPA má některé společné rysy s několika dalšími oblastmi, včetně: