Johdatus tilastotieteeseen

Oppitunti:
Aihe:

4.3.2 Korrelaatiokerroin ja lineaarinen riippuvuus

Korrelaatiokerroin kuvaa muuttujien lineaarista riippuvuutta. Lineaarisen funktion y = a + b × x kuvaaja on suora. Funktion kaavassa a ja b ovat lukuja joita kutsutaan parametreiksi. Korrelaatio on suurimmillaan (r = 1), kun riippuvuuden määrää kasvava suora.

Alla olevissa kuvioissa aineisto on luotu laskemalla kutakin x-akselin arvoa vastaava y-koordinaatti lineaarisen funktion kaavasta.

Kuvio 1. Kasvavan suoran korrelaatiokerroin on r = 1

Kuvio 1. Kasvavan suoran korrelaatiokerroin on r = 1

Pienin mahdollinen korrelaatiokertoimen arvo r = –1 liittyy laskevaan suoraan.

Kuvio 2. Laskevan suoran korrelaatiokerroin on r = –1

Kuvio 2. Laskevan suoran korrelaatiokerroin on r = -1

Korrelaatiokertoimen avulla ei välttämättä havaita ollenkaan epälineaarista vahvaa riippuvuutta. Jos muuttujan y arvo on laskettu x:n epälineaarisena funktiona (paraabeli) ja se määräytyy siis täysin muuttujan x arvosta, korrelaatiokerroin on silti r = 0.

Kuvio 3. Paraabelin määräämässä aineistossa korrelaatiokerroin on r = 0

Kuvio 3. Paraabelin määräämässä aineistossa korrelaatiokerroin on r = 0

Muuttujien riippuvuutta tutkittaessa pitäisi aina katsoa hajontakuviota. 


Jaa