Die Spearman Korrelation versucht ein Manko der linearen Korrelation auszubessern. Die lineare Korrelation bringt schlechtere Resultate, wenn die Messreihen zwar zusammenhangen, sich aber nicht gleichmässig verändern.
Es folgt ein Beispiel dafür...
In diesem Fall ist die lineare Korrelation optimal. (Pearson = lineare Korrelation)
In diesem Fall hängen A und B sichtlich zusammen, die lineare Korrelation liefert aber einen abweichenden Wert. Der Wert der Spearman Korrelation ist besser.
Die Idee hinter der Spearmans Korrelation ist einfach: statt den Zahlenwerten der Eingangsgrössen verwenden wir die Reihenfolgeposition des Zahlenwerts innerhalb der einzelnen Grösse. Wir verlieren also die Grössenordnung und behalten nur noch die Reihenfolge.
Den Rang innerhalb der Zahlenreihe A stellen wir dar als R(A).
| Spearmans Korrelation (Rank). | |
| Lineare Korrelation (Pearson). | |
| Kovarianz zwischen R(A) und R(B). | |
| Standardabweichung des Rang von A. |
Die Formel ist dieselbe wie bei der Pearsons, oder linearen Korrelation. Statt A und B verwenden wir lediglich den Rang von A R(A) oder den Rang von B R(B).
Die Fachbegriffe für die verschiedene Skalierungen sind:
| Ordinalskalierung | Die Darstellung als reale Zahlenwerte, wie in Spalten A und B. |
| Rangskalierung | Die Darstellung als Reihenfolgeposition, wie in Spalten R(A) und R(B). |