Johdatus tilastotieteeseen

Oppitunti:
Aihe:

2.1.4 Diskreetti ja jatkuva muuttuja. Muuttujan jakauma

Muuttuja on diskreetti, kun sen mahdolliset arvot voidaan luetella. Esimerkiksi mahdollisia äidinkieliä on rajallinen määrä, ja ne kaikki voidaan luetella. Laatueroasteikolla mitattu muuttuja, kuten sukupuoli, äidinkieli ja kotikunta, on diskreetti. Lukumäärääkin kuvaava muuttuja on diskreetti. 

Jatkuva muuttuja saa sitä tarkempia arvoja, mitä tarkemmin ominaisuutta mitataan. Mahdollisia arvoja ei voi listata etukäteen. Jatkuvan muuttujan arvona on teoriassa mikä tahansa reaaliluku esimerkiksi 0:sta 1:een eli mahdollisia arvoja on pienelläkin välillä äärettömän monta. Esimerkiksi asunnon pinta-alaa voidaan periaatteessa mitata miten tarkkaan halutaan. Myös aikaa voidaan mitata mielivaltaisen tarkasti, joten ikä on jatkuva muuttuja.

Muuttujan jatkuvuus on suositeltavaa joidenkin tilastollisten menetelmien soveltamiseksi. Esimerkiksi korrelaatiokerroin ja regressiomallit (ks. 4 Vaihtelu ja riippuvuus) sopivat parhaiten jatkuvien muuttujien riippuvuuden tutkimiseen. Jos diskreetillä muuttujalla on ainakin satoja tai miljoonia mahdollisia arvoja, kuten valtion väestömäärällä, muuttujaa kohdellaan kuitenkin yleensä jatkuvana muuttujana.

Muuttujan jakauma

Muuttujan jakauma kuvaa, miten yleisiä muuttujan eri arvot ovat. Yksinkertaisimmassa tapauksessa muuttujalla on vain kaksi mahdollista arvoa (esimerkki 1).

Diskreetin muuttujan jakauma voidaan usein määritellä täydellisesti taulukolla. Visuaalisesti jakaumaa kuvataan yleensä histogrammilla, jossa kuhunkin mahdolliseen muuttujan arvoon liitetään pylväs, jonka korkeus kuvaa arvon yleisyyttä tai suhteellista yleisyyttä (ks. Tilastojen ABC -kurssi 4.2 Jakauma).

Histogrammin x-akselin arvot ovat muuttujan saamia arvoja. Histogrammi on helpoiten tulkittavissa, kun muuttuja on välimatka- tai suhdeasteikollinen.

Jatkuvalla muuttujalla voi olla äärettömän monta arvoa. Jakaumaa kuvaava histogrammi muodostetaan käytännössä luokittelemalla muuttuja. Esimerkiksi iän jakaumasta piirretään histogrammi ikäluokka-muuttujan avulla (esimerkki 2).

EsimerkitHarjoitukset

Jaa