
Johdatus tilastotieteeseen
4.5.1 Kahden muuttujan regressioanalyysi
Kahden muuttujan regressioanalyysissä on tavoitteena etsiä luvut a ja b, joilla suora y = a + b × x sopii hyvin aineistoon eli kuvaa "mahdollisimman hyvin" y:n riippuvuutta x:stä.
Yleisesti käytetyssä pienimmän neliösumman menetelmässä suoran sopivuutta arvioidaan seuraavasti: Lasketaan aineistosta x-muuttujan jokaista arvoa vastaava suoran kaavasta laskettu arvo. Näitä verrataan aineiston y-muuttujan arvoihin. Lasketaan kyseisten arvojen erotusten neliöiden summa eli neliösumma. Sen suuruus riippuu luvuista a ja b. Pienimmän neliösumman menetelmässä etsitään sellaiset luvut a ja b, joilla neliösumma on mahdollisimman pieni.
Alla oleva kuvio perustuu aineistoon, jossa x-muuttujana on teollisuudessa työskentelevien osuus koko työvoimasta ja y-muuttujana keskimääräiset henkilökohtaiset tulot. Aineistoon sovitettu suora on nouseva eli mitä suurempi osa työvoimasta on teollisuudessa, sitä suuremmat ovat tulot.
Kuvio. Pienimmän neliösumman menetelmällä sovitettu suora
Lähde: The Data and Story Library [viitattu: 12.4.2016]. Saantitapa: https://www3.nd.edu/~busiforc/handouts/Data%20and%20Stories/regression/oecd%20economic%20development/oecd.html
EsimerkitJaa