Johdatus tilastotieteeseen

Oppitunti:
Aihe:

3.2 Hajontaluvut

Hajontaluku kuvaa jakauman keskittymistä keskiarvon tai mediaanin lähelle.

Yksinkertaisin hajontaluku on vaihteluväli, ääriarvojen erotus. Esimerkiksi pituuksien 152 cm, 167 cm, 198 cm vaihteluväli on [152, 198] ja vaihteluvälin pituus on 46 cm (198 cm -152 cm = 46 cm).

Kvartiilit

Mediaanin avulla muuttujan jakauma jaetaan kahteen osaan: noin puolet arvoista on mediaania pienempiä ja puolet on mediaania suurempia. Hajonnan kuvaamiseksi määritellään alakvartiili, jota pienempiä arvoja on aineistossa 25 % ja yläkvartiili, jota suurempia arvoja on aineistossa noin 25 %. Nämä prosenttiluvut eivät ole aina tarkkoja, vaan riippuvat jonkin verran aineiston koosta ja diskreetin muuttujan tapauksessa mahdollisista arvoista. 

Arvojen valtaosan hajontaa kuvaa vaihteluväliä paremmin kvartiiliväli, joka on väli alakvartiilista yläkvartiiliin. Tämän välin pituuden puolikasta kutsutaan kvartiilipoikkeamaksi. Vaihteluvälin pituus on paljon herkempi poikkeavan pienien tai suurien havaintojen esiintymiselle. 

Varianssi

Varianssi kuvaa, kuinka paljon muuttujan arvot keskimäärin poikkeavat keskiarvosta. Arvon poikkeamaa keskiarvosta mitataan arvon ja keskiarvon erotuksen neliöllä (toinen potenssi). Erotuksen neliöistä lasketaan keskiarvo:

Keskihajonta

Estimoinnin tulosten yhteydessä ei yleensä ilmoiteta varianssia, vaan hajontalukuna käytetään varianssin neliöjuurta, keskihajontaa. Otoksesta estimoidaan perusjoukon keskihajontaa seuraavalla kaavalla. Kuten varianssin kaavassa, ensin lasketaan havaintojen ja keskiarvon erotuksen neliöitä. Erotusten neliöiden summa jaetaan kuitenkin luvulla n-1. Jakolaskun tuloksesta otetaan vielä neliöjuuri:

Esimerkissä 1 tutkitaan, mille välille esimerkiksi 95 % havainnoista sattuu. Tämän välin määrittelyyn käytetään keskihajontaa. Esimerkissä 2 lasketaan pienestä aineistosta vaihteluväli ja sen pituus.

EsimerkitHarjoitukset

Jaa