En matematisk demonstration af forholdet mellem de to er her: Pearsons korrelation og mindste kvadraters regressionsanalyse.
Jeg er ikke sikker på, om der er en geometrisk eller enhver anden intuition, der kan tilbydes bortset fra matematikken, men hvis jeg kan tænke på en, opdaterer jeg dette svar.
Opdatering: Geometrisk intuition
Her er en geometrisk intuition, jeg kom på. Antag at du har to variabler $ x $ og $ y $, som er middelcentrerede. (Hvis vi antager, at middelcentreret lader os ignorere skæringspunktet, der forenkler den geometriske intuition lidt.) Lad os først overveje geometrien af lineær regression. I lineær regression modellerer vi $ y $ som følger:
$ y = x \ beta + \ epsilon $.
Overvej situationen, når vi har to observationer fra ovenstående data genereringsproces givet af parene ($ y_1, y_2 $) og ($ x_1, x_2 $). Vi kan se dem som vektorer i to-dimensionelt rum som vist i nedenstående figur:
alt tekst http://a.imageshack.us/img202/669/linearregression1.png
Således, med hensyn til ovenstående geometri, er vores mål at finde en $ \ beta $ således, at vektoren $ x \ \ beta $ er tættest på vektoren $ y $. Bemærk, at forskellige valg af $ \ beta $ skalerer $ x $ passende. Lad $ \ hat {\ beta} $ være værdien af $ \ beta $, der er vores bedst mulige tilnærmelse til $ y $, og betegne $ \ hat {y} = x \ \ hat {\ beta} $. Således
$ y = \ hat {y} + \ hat {\ epsilon} $
Fra et geometrisk perspektiv har vi tre vektorer. $ y $, $ \ hat {y} $ og $ \ hat {\ epsilon} $. En lille tanke antyder, at vi skal vælge $ \ hat {\ beta} $, så tre vektorer ligner den nedenfor: alt tekst http://a.imageshack.us/img19/9524/intuitionlinearregressi.png
Med andre ord skal vi vælge $ \ beta $ således at vinklen mellem $ x \ \ beta $ og $ \ hat {\ epsilon} $ er 90 0 sup >.
Så hvor meget variation i $ y $ har vi forklaret med denne projektion af $ y $ på vektoren $ x $. Da data er middelcentreret, er variansen i $ y $ lig med ($ y_1 ^ 2 + y_2 ^ 2 $), hvilket er kvadratet for afstanden mellem det punkt, der er repræsenteret af punktet $ y $ og oprindelsen. Variationen i $ \ hat {y} $ er på samme måde afstanden fra punktet $ \ hat {y} $ og oprindelsen og så videre.
Ved den Pythagoras sætning har vi:
$ y ^ 2 = \ hat {y} ^ 2 + \ hat {\ epsilon} ^ 2 $
Derfor er andelen af variansen forklaret med $ x $ $ \ frac {\ hat {y} ^ 2} {y ^ 2} $. Bemærk også, at $ cos (\ theta) = \ frac {\ hat {y}} {y} $. og wiki fortæller os, at den geometriske fortolkning af korrelation er, at korrelation er lig med cosinus for vinklen mellem de middelcentrerede vektorer.
Derfor har vi det krævede forhold:
(Korrelation) 2 = Andel af variation i $ y $ forklaret med $ x $.
Håber det hjælper.