Čekací doba mezi erupcemi a dobou trvání erupce na gejzír Old Faithful v Yellowstonském národním parku, Wyoming, USA.
Scatterplot, scatter diagram nebo scatter graf je graf používaný ve statistice k vizuálnímu zobrazení a porovnání dvou nebo více souborů souvisejících kvantitativních nebo numerických dat zobrazením pouze konečného počtu bodů, z nichž každý má souřadnici na vodorovné a svislé ose.
Scatter diagram je jedním ze sedmi základních nástrojů kontroly kvality, mezi které patří histogram, Paretova diagram, kontrolní list, kontrolní diagram, diagram příčiny a následku a vývojový diagram.
Například ke studiu účinků kapacity plic na schopnost zadržet dech by si statistik vybral skupinu lidí ke studiu a otestoval by kapacitu plic každého z nich (první soubor dat) a to, jak dlouho by tato osoba dokázala zadržet dech (druhý soubor dat). Poté by nastavili data do grafu rozptylu, přiřadili by „kapacitu plic“ vodorovné ose a „čas zadržení dechu“ svislé ose. Osoba s kapacitou plic 400 kubíků, která by zadržela dech na 21,7 sekundy, by byla reprezentována jedinou tečkou na grafu rozptylu v bodě (400, 21,7) v kartézských souřadnicích. Graf rozptylu všech lidí ve studii by statistikovi umožnil získat vizuální srovnání obou souborů dat a pomohl by určit, jaký vztah by mezi nimi mohl existovat.
Graf rozptylu ukazuje pozici všech případů v souřadnicovém systému x-y nebo x-y-z. Vztah mezi proměnnými intervalu lze určit z grafu rozptylu.
Tečka v těle grafu představuje průnik dat na ose x a ose y.
Jednou z výhod scatterplotu je, že nevyžaduje, aby uživatel zadával závislé nebo nezávislé proměnné. Oba typy proměnných mohou být vyneseny na obou osách. Scatterploty představují asociaci (ne příčinnou souvislost) mezi dvěma proměnnými.
Scatterplot může ukázat tři vztahy, kladný (stoupající), záporný (klesající) a žádný vztah, který je různorodý. Je-li sestupný vzorec teček od levého horního do pravého dolního rohu, naznačuje to negativní korelaci mezi studovanými proměnnými. Je-li sestupný sklon od pravého horního do levého dolního rohu, naznačuje to pozitivní korelaci. Pro studium korelace mezi proměnnými lze nakreslit přímku, která nejlépe vyhovuje. Rovnici pro přímku, která nejlépe vyhovuje, lze vypočítat pomocí korelačního koeficientu.
(V teorii pravděpodobnosti a statistice korelace, také nazývaná korelační koeficient, označuje sílu a směr lineárního vztahu mezi dvěma náhodnými proměnnými. V obecném statistickém použití korelace nebo korelace odkazuje na odchýlení dvou proměnných od nezávislosti, i když korelace neznamená kauzalitu. V tomto širokém smyslu existuje několik koeficientů, měřících stupeň korelace, přizpůsobených povaze dat.
Pro různé situace se používá řada různých koeficientů. Nejznámější je Pearsonův korelační koeficient produktového momentu, který se získává vydělením kovariance obou proměnných součinem jejich směrodatných odchylek. Navzdory svému názvu byl poprvé zaveden Francisem Galtonem.)