Histogram

Ve statistice je histogram grafické zobrazení tabulkových frekvencí. To znamená, že histogram je grafická verze tabulky, která ukazuje, jaký podíl případů spadá do každé z několika nebo mnoha specifikovaných kategorií. Kategorie jsou obvykle specifikovány jako nepřekrývající se intervaly některé proměnné. Kategorie (sloupce) musí sousedit.

Součástí Sedmi nástrojů kvality (Nástroje pro zlepšení kvality, které zahrnují histogram, Paretův diagram, kontrolní list, kontrolní diagram, diagram příčiny a následku, vývojový diagram a diagram rozptylu.) viz []

Údaje v následujících tabulkách jsou graficky znázorněny níže uvedenými diagramy. Zajímavým rysem obou diagramů je špička v kategorii 30 až 35 minut. Zdá se pravděpodobné, že se jedná o artefakt: půlhodina je běžnou jednotkou neformálního měření času, takže lidé, jejichž cestovní doba byla možná o něco menší nebo o něco větší než 30 minut, by se mohli přiklonit k odpovědi „30 minut“.

Histogram cestovní doby, sčítání lidu USA 2000. Plocha pod křivkou se rovná celkovému počtu případů. Tento diagram používá Q/šířku z tabulky.

Tento histogram zobrazuje počet případů na jednotkový interval tak, aby se výška každé tyče rovnala podílu celkového počtu lidí v průzkumu, kteří spadají do této kategorie. Plocha pod křivkou představuje celkový počet případů (124 milionů). Tento typ histogramu je ideální pro přehled absolutních čísel.

Histogram cestovní doby, sčítání USA 2000. Plocha pod křivkou se rovná 1. Tento diagram používá Q/total/width z tabulky.

Tento histogram se od prvního liší pouze ve svislé stupnici. Výška každého pruhu je desetinné procento z celku, který každá kategorie představuje, a celková výška všech pruhů je rovna 1, desetinný ekvivalent je 100%. Tato verze je ideální pro porovnávání poměrů.

V obecnějším matematickém smyslu je histogram jednoduše mapování, které počítá počet pozorování, která spadají do různých disjunktních kategorií (známých jako bins), zatímco graf histogramu, který je často vyučován na střední škole, je pouze jedním ze způsobů, jak reprezentovat histogram. Pokud tedy necháme N jako celkový počet pozorování a n jako celkový počet bins, histogram splňuje následující podmínky:

Doporučujeme:  Efekt Johna Henryho

kde k je index nad koše.

Kumulativní histogram je mapování, které počítá kumulativní počet pozorování ve všech nádobách až do specifikované nádoby. To znamená, že kumulativní histogram histogramu je definován jako: