Johdatus tilastotieteeseen

Oppitunti:
Aihe:

4.5.1 Kahden muuttujan regressioanalyysi

Kahden muuttujan regressioanalyysissä on tavoitteena etsiä luvut a ja b, joilla suora y = a + b × x sopii hyvin aineistoon eli kuvaa "mahdollisimman hyvin" y:n riippuvuutta x:stä.

Yleisesti käytetyssä pienimmän neliösumman menetelmässä suoran sopivuutta arvioidaan seuraavasti: Lasketaan aineistosta x-muuttujan jokaista arvoa vastaava suoran kaavasta laskettu arvo. Näitä verrataan aineiston y-muuttujan arvoihin. Lasketaan kyseisten arvojen erotusten neliöiden summa eli neliösumma.  Sen suuruus riippuu luvuista a ja b. Pienimmän neliösumman menetelmässä etsitään sellaiset luvut a ja b, joilla neliösumma on mahdollisimman pieni.

Alla oleva kuvio perustuu aineistoon, jossa x-muuttujana on teollisuudessa työskentelevien osuus koko työvoimasta ja y-muuttujana keskimääräiset henkilökohtaiset tulot. Aineistoon sovitettu suora on nouseva eli mitä suurempi osa työvoimasta on teollisuudessa, sitä suuremmat ovat tulot.

Kuvio. Pienimmän neliösumman menetelmällä sovitettu suora

Kuvio. Pienimmän neliösumman menetelmällä sovitettu suora

Lähde: The Data and Story Library [viitattu: 12.4.2016]. Saantitapa: https://www3.nd.edu/~busiforc/handouts/Data%20and%20Stories/regression/oecd%20economic%20development/oecd.html

Esimerkit

Jaa