Scatterplot

Čekací doba mezi erupcemi a dobou trvání erupce na gejzír Old Faithful v Yellowstonském národním parku, Wyoming, USA.

Scatterplot, scatter diagram nebo scatter graf je graf používaný ve statistice k vizuálnímu zobrazení a propojení dvou číselných proměnných vícerozměrné datové sady zobrazením dat jako sbírky bodů, z nichž každý má jednu souřadnici na vodorovné a jednu na svislé ose.

Scatter diagram je jedním ze základních nástrojů kontroly kvality, mezi které patří histogram, Paretova diagram, kontrolní list, kontrolní diagram, diagram příčiny a následku a vývojový diagram.

Například ke studiu účinků kapacity plic na schopnost zadržet dech by si statistik vybral skupinu lidí ke studiu a určil by kapacitu plic každého z nich (první proměnná) a jak dlouho by tato osoba dokázala zadržet dech (druhá proměnná). Poté by nastavili data do grafu rozptylu, přiřadili by „kapacitu plic“ vodorovné ose a „čas zadržení dechu“ svislé ose. Osoba s kapacitou plic 400 kubíků, která by zadržela dech na 21,7 sekundy, by byla reprezentována jedinou tečkou na grafu rozptylu v bodě (400, 21,7) v kartézských souřadnicích. Graf rozptylu všech lidí ve studii by statistikovi umožnil získat vizuální porovnání obou proměnných v souboru dat a pomohl by určit, jaký vztah by mezi nimi mohl existovat.

Scatterplot nevyžaduje, aby uživatel zadával závislé nebo nezávislé proměnné. Oba typy proměnných mohou být vyneseny na obou osách. Scatterplots představují asociaci (ne příčinnou souvislost) mezi dvěma proměnnými.

Scatterplot může ukazovat různé druhy vztahů, včetně kladných (stoupajících), záporných (klesajících) a nulových vztahů. Pokud se vzorec teček svažuje z levé dolní do pravé horní, naznačuje to pozitivní korelaci mezi zkoumanými proměnnými. Pokud se vzorec teček svažuje z levé horní do pravé dolní, naznačuje to negativní korelaci. Za účelem studia korelace mezi proměnnými lze nakreslit přímku, která nejlépe vyhovuje. Rovnici pro přímku, která nejlépe vyhovuje, lze vypočítat metodou lineární regrese.