Tilastojen ABC

Oppitunti:
Aihe:

4.2 Jakauma

Tilastomittari tarkastelee yhtä ominaisuutta kerrallaan ja mittaa tietyn ominaisuuden arvon kunkin havainnon (esimerkiksi henkilön) kohdalla erikseen. Koska eri havaintojen mittaustulokset eroavat toisistaan, tulokset muodostavat tarkasteltavan ominaisuuden suhteen jakauman.

Jakaumaa voidaan kuvata mitta-asteikolla esimerkiksi histogrammin avulla. Se esittää tarkasteltavien arvojen jakautumisen valitulla luokkajaolla graafisesti. Se koostuu palkeista, joiden korkeus esittää kyseiseen luokkaan kuuluvien tapausten määrää. Tutkittavan joukon tapaukset on sijoitettu tukkimiehen kirjanpidon tapaan, käytetyn mittarin luokkiin ikään kuin päällekkäin. Näin saatu kuvio kuvaa, kuinka monta tapausta kuhunkin luokkaan sijoittuu.

Kuvio. Tukkimiehen kirjanpito ja histogrammi satunnaisen ihmisryhmän pituuksista

Kuvio tukkimiehen kirjanpidosta

 

Kuvio havaintojen lukumäärästä

Jakauman huipuksi kutsutaan sitä kohtaa, johon osuu eniten havaintoja. Usein se on lähellä jakauman keskiarvoa.

Käsittelyn helpottamiseksi jatkuva-arvoiset jakaumat esitetään yleensä luokiteltuina. Luokittelu on ikään kuin karkea mittauslaite, joka ei ota huomioon pieniä yksityiskohtia. Luokittelu ei saisi muuttaa havaitun jakauman muotoa olennaisesti, mutta oikea tapa luokitella havaintoja riippuu aina tiedon käyttötarkoituksesta.

Jakauman muoto vaihtelee

Jakaumat ovat muodoltaan hyvin monenlaisia. Yleisimmin tunnettu jakauma on normaalijakauma, jota joskus kutsutaan myös Gaussin käyräksi. Siinä valtaosa havainnoista keskittyy keskiarvon lähelle ja se on symmetrinen. Symmetrisyys tarkoittaa, että positiivisia poikkeamia keskiarvosta on suunnilleen saman verran kuin negatiivisia. Kun keskiarvosta edetään positiiviseen tai negatiiviseen suuntaan, havaintojen määrä vähenee. Normaalijakaumassa puolet havainnoista on korkeintaan keskihajonnan etäisyydellä keskiarvosta.

Kaikki jakaumat eivät tietenkään ole normaalijakaumia. Jakaumassa voi olla kaksi huippua tai jakaumat voivat olla vinoja. Vinolla jakaumalla tarkoitetaan sitä, että jakauman huippu sijaitsee jakauman toisessa reunassa. Suuri osa tilastollisista malleista ja teoriasta on kuitenkin tehty normaalijakaumaa ajatellen. Ajatuksena on, että suurissa joukoissa asiat jakautuvat sattumanvaraisesti niin, että syntyy kellomainen normaalijakauma.

EsimerkitHarjoitukset

Jaa