Ve statistice je regresní analýza metodou pro vysvětlení jevů a predikci budoucích událostí. V regresní analýze je koeficient korelace r mezi náhodnými veličinami X a Y kvantitativním indexem asociace mezi těmito dvěma veličinami. Ve své čtvercové podobě, jako koeficient determinace r2, udává velikost rozptylu v proměnné kritéria Y, která je započítána odchylkou v proměnné prediktoru X. V regresní analýze se pro vysvětlení variability proměnné kritéria Y používá množina prediktorů X1, X2, …. Protějšek koeficientu determinace r2 je koeficient vícenásobného určení, R2. Druhá odmocnina koeficientu vícenásobného určení je koeficient vícenásobné korelace, R.
Konceptualizace vícenásobné korelace
Intuitivní přístup k analýze mnohonásobné regrese spočívá v součtu čtvercových korelací mezi proměnnými prediktoru a proměnnou kritéria za účelem získání indexu celkového vztahu mezi proměnnými prediktoru a proměnnou kritéria. Takový součet je však často větší než jedna, což naznačuje, že jednoduchý součet čtvercových koeficientů korelací není správný postup. Ve skutečnosti je jednoduchý součet čtvercových koeficientů korelací mezi proměnnými prediktoru a proměnnou kritéria správný postup, ale pouze ve zvláštním případě, kdy proměnné prediktoru nekorelují. Jsou-li prediktory příbuzné, musí být jejich vzájemné korelace odstraněny tak, aby byly zahrnuty pouze jedinečné příspěvky každého prediktoru k vysvětlení kritéria.
Fundamental equation of multiple regression analysis
Zpočátku se pro všechny proměnné zapojené do analýzy vypočítá matice korelací R. Tuto matici lze pojmout jako supermatici, která se skládá z vektoru křížových korelací mezi proměnnými prediktoru a proměnnou kritéria c, její transpozice c’ a matice vzájemných korelací mezi proměnnými prediktoru Rxx. Základní rovnice analýzy mnohonásobné regrese je
Výraz na levé straně značí koeficient vícenásobného určení (čtvercový koeficient vícenásobné korelace). Výrazy na pravé straně jsou transponovaný vektor křížových korelací c‘, matice mezikorelací Rxx, která má být invertována (srov. maticová inverze), a vektor křížových korelací c. Předpoklad vektoru křížových korelací jeho transpozicí mění koeficienty korelací na koeficienty určení. Inverzní matice mezikorelací odstraňuje redundantní rozptyl z mezikorelací prediktorové množiny proměnných. Tyto ne-redundantní křížové korelace se sčítají, aby se získal vícenásobný koeficient určení R2. Druhá odmocnina tohoto koeficientu je koeficient vícenásobné korelace R.