Graf rozptylu

Doba čekání mezi erupcemi a doba trvání erupce gejzíru Old Faithful v Yellowstonském národním parku ve Wyomingu, USA.

Graf rozptylu, rozptylový diagram nebo graf rozptylu je graf používaný ve statistice k vizuálnímu zobrazení a propojení dvou číselných proměnných vícerozměrného souboru dat zobrazením dat jako souboru bodů, z nichž každý má jednu souřadnici na vodorovné a jednu na svislé ose.

Rozptylový diagram je jedním ze základních nástrojů kontroly kvality, mezi které patří histogram, Paretův diagram, kontrolní list, regulační diagram, diagram příčin a následků a vývojový diagram.

Například při studiu vlivu kapacity plic na schopnost zadržet dech by statistik vybral skupinu lidí, kterou by studoval, a u každého z nich by určil kapacitu plic (první proměnná) a dobu, po kterou by dokázal zadržet dech (druhá proměnná). Poté by údaje sestavil do grafu rozptylu, přičemž by na vodorovnou osu přiřadil „kapacitu plic“ a na svislou osu „dobu zadržení dechu“. Osoba s kapacitou plic 400 cm3 , která zadrží dech na 21,7 sekundy, by byla na grafu rozptylu znázorněna jediným bodem v bodě (400, 21,7) v kartézských souřadnicích. Graf rozptylu všech osob ve studii by statistikovi umožnil získat vizuální srovnání obou proměnných v souboru dat a pomohl by určit, jaký vztah mezi nimi může existovat.

Rozptylový graf nevyžaduje, aby uživatel zadával závislé nebo nezávislé proměnné. Na obě osy lze vynést libovolný typ proměnné. Rozptylové grafy znázorňují souvislost (nikoli příčinnou souvislost) mezi dvěma proměnnými.

Graf rozptylu může zobrazovat různé druhy vztahů, včetně kladných (rostoucích), záporných (klesajících) a žádných vztahů. Pokud se vzor bodů svažuje zleva dolů do prava nahoru, naznačuje to pozitivní korelaci mezi zkoumanými proměnnými. Pokud se vzor bodů svažuje zleva nahoru doprava, naznačuje to negativní korelaci. Pro studium korelace mezi proměnnými lze nakreslit přímku nejlepší shody. Rovnici pro přímku nejlepší shody lze vypočítat pomocí metody lineární regrese.