Beginnen wir mit zwei Datenreihen mit je sechs Werten. In dieser Tabelle als Spalten A und B aufgeführt. Uns interessiert, ob diese beiden Spalten ähnliche Informationen beinhalten.
Im Diagramm dargestellt sehen wir, dass beide Spalten einen ansteigenden Trend aufweisen.
Verwendet man jede Spalte als Achse, so ist der gemeinsame Trend noch klarer ersichtlich. Die blaue Linie stellt die lineare Regression dar, die Gerade mit der kleinsten Fehlersumme.
Die Methoden der Korrelationen versuchen nun, einen Zahlenwert anzugeben, welcher aussagt, ob sich zwei Datenreihen gemeinsam verändern. Datenreihen welche sich gemeinsam verändern sind redundant. Redundante Datenreihen bringen keinen Vorteil als Eingabe für unseren Machine Learning Algorithmus. Wir können sie also weglassen.