( ZF Bortz, S. 197 f. ) Ein Korrelationskoeffizient kann, unabhängig von den Verteilungseigenschaften, aus jeder intervall-skalierten bivarianten Grundgesamtheit errechnet werden.
Für die signifikanzstatistische Absicherung muß die Grundgesamtheit jedoch bivariant normal-verteilt sein.
Kriterien einer bivarianten Normalverteilung :
a) Die beiden Einzelvariablen sind jeweils normalverteilt
b) Die beiden Variablen sind mindestens intervallskaliert
c) Homoskedastizität : Die Varianzen der zu einem x-Wert ( y-Wert ) gehörenden y-Werte ( x- Werte ) sind gleich.
d) Die zu einer jeden Ausprägung des Merkmals X gehörenden y-Werte ( Arrayverteilungen ) sind normalverteilt.
Kann die Voraussetzung der bivariant normalverteilten Grundgesamtheit als erfüllt gelten, stellt r einen erschöpfenden und konsistenten Schätzwert für die (Produkt-Moment)-Korrelation in der Population dar.
r schätzt jedoch nicht erwartungstreu, sondern verschätzt um den Betrag 1/n, also bei größer werdenden Stichprobenumfan zunehmend vernachlässigbar.
Selektionsfehler
( Bortz, S. 198 ) Für die Verallgmeinerung einer Korrelation ist zu beachten, dass ...
- die untersuchte Stichprobe tatsächlich zufällig gezogen ist und somit
- keinerlei systematische Fehler aufweist.
- die gesamte Variationsbreite der Merkmale gesichert ist.
- keine Extremgruppenbildung vorliegt.