Ve statistice je Pearsonův korelační koeficient produktového momentu (někdy známý jako PMCC) (r) měřítkem korelace dvou proměnných X a Y naměřených na stejném objektu nebo organismu, tj. měřítkem tendence proměnných společně vzrůstat nebo klesat. Je definován jako součet součinů standardních skóre obou měr vydělených stupni volnosti:
Všimněte si, že tento vzorec předpokládá, že skóre Z se vypočítá pomocí směrodatných odchylek, které se vypočítají pomocí n − 1 ve jmenovateli.
Získaný výsledek se rovná vydělení kovariance mezi oběma proměnnými součinem jejich směrodatných odchylek.
Pearsonův koeficient je statistika, která odhaduje korelaci dvou daných náhodných veličin.
Lineární rovnici, která nejlépe popisuje vztah mezi X a Y, lze najít pomocí lineární regrese. Tuto rovnici lze použít k „predikci“ hodnoty jednoho měření ze znalosti druhého. To znamená, že pro každou hodnotu X rovnice vypočte hodnotu, která je nejlepším odhadem hodnot Y odpovídajících specifické hodnotě. Označujeme tuto predikovanou proměnnou pomocí Y‘.
Jakoukoli hodnotu Y lze tedy definovat jako součet Y′ a rozdílu mezi Y a Y′:
Rozptyl Y se rovná součtu rozptylu obou složek Y:
Vzhledem k tomu, že koeficient determinace znamená, že sy.x2 = sy2(1 − r2), můžeme odvodit identitu
Druhá mocnina r se konvenčně používá jako míra asociace mezi X a Y. Například pokud je koeficient 0,90, pak 81% rozptylu Y může být „započítáno“ změnami v X a lineárním vztahem mezi X a Y.
Průměr (Aritmetika, Geometrie) – Medián – Režim – Výkon – Odchylka – Směrodatná odchylka
Testování hypotéz – Význam – Nullova hypotéza/Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu
Funkce přežití – Kaplan-Meier – Logrank test – Četnost selhání – Proporcionální modely nebezpečnosti
Normal (zvonová křivka) – Poisson – Bernoulli
Matoucí veličina – Pearsonův korelační koeficient produktového momentu – Rank korelace (Spearmanův korelační koeficient hodnosti, Kendall tau korelační koeficient hodnosti)
Lineární regrese – Nelineární regrese – Logistická regrese