
Johdatus tilastotieteeseen
4.3.2 Korrelaatiokerroin ja lineaarinen riippuvuus
Korrelaatiokerroin kuvaa muuttujien lineaarista riippuvuutta. Lineaarisen funktion y = a + b × x kuvaaja on suora. Funktion kaavassa a ja b ovat lukuja joita kutsutaan parametreiksi. Korrelaatio on suurimmillaan (r = 1), kun riippuvuuden määrää kasvava suora.
Alla olevissa kuvioissa aineisto on luotu laskemalla kutakin x-akselin arvoa vastaava y-koordinaatti lineaarisen funktion kaavasta.
Kuvio 1. Kasvavan suoran korrelaatiokerroin on r = 1
Pienin mahdollinen korrelaatiokertoimen arvo r = –1 liittyy laskevaan suoraan.
Kuvio 2. Laskevan suoran korrelaatiokerroin on r = –1
Korrelaatiokertoimen avulla ei välttämättä havaita ollenkaan epälineaarista vahvaa riippuvuutta. Jos muuttujan y arvo on laskettu x:n epälineaarisena funktiona (paraabeli) ja se määräytyy siis täysin muuttujan x arvosta, korrelaatiokerroin on silti r = 0.
Kuvio 3. Paraabelin määräämässä aineistossa korrelaatiokerroin on r = 0
Muuttujien riippuvuutta tutkittaessa pitäisi aina katsoa hajontakuviota.
Jaa