
Johdatus tilastotieteeseen
4.5 Regressio
Regressio määrittelee matemaattisen funktion, joka kuvaa muuttujan riippuvuutta toisesta muuttujasta. Regressiota käytetään usein tutkittaessa syy-seuraussuhdetta.
Ihannetapauksessa funktio kuvaa, millaisia seurauksia havaitaan, kun muuttujan arvo muuttuu. Regressiolla voidaan kuvata esimerkiksi, että jonkin muuttujan arvon kaksinkertaistuessa (syy) toisen muuttujan arvo nelinkertaistuu (seuraus). Korrelaatiolla voi todeta vain riippuvuuden olemassaolon. On mielenkiintoisempaa tutkia, millainen matemaattinen funktio kuvaa parhaiten riippuvuutta.
Yksinkertaisin funktio on suora, esimerkiksi y = 2 × x tai y = 2 × x + 1. Tässä y riippuu x:stä, joten y:tä kutsutaan riippuvaksi muuttujaksi. x:ää kutsutaan riippumattomaksi muuttujaksi. Kaavan avulla voidaan verrata odotettuja y:n arvoja erilaisilla x:n arvoilla.
Esimerkiksi kaava y = 2 × x + 1 näyttää, että x:n arvoilla x = 2 ja x = 4 y:n arvot ovat 5 ja 9. Suoran kulmakertoimesta (2) nähdään, että x:n kasvaminen kahdella kasvattaa y:n arvoa 4:llä. Funktion viimeinen termi kuvaa, missä suora leikkaa y-akselin: arvolla x = 0, y = 1.
Jaa