Johdatus tilastotieteeseen

Oppitunti:
Aihe:

2.4.3 Laatikko-janakuvio

Laatikko-janakuviossa (boxplot, box-and-whisker plot) muuttujan jakaumaa kuvataan yksinkertaisella kuviolla, jonka komponentteina ovat laatikko, jana ja yksittäisiä pisteitä.

Laatikko sisältää puolet havainnoista, ja arvojen mediaani merkitään laatikon poikki kulkevalla viivalla. Jana ulottuu laatikon ylä- ja alapuolelle esimerkiksi ääriarvoihin tai arvoihin, joiden ulkopuolella on 4 % havainnoista. Ääriarvot esitetään joskus erillisinä pisteinä.

Tämä diagrammi soveltuu hyvin silloin, kun verrataan muuttujan jakaumaa esimerkiksi eri alueilla.

Alla oleva kuvio perustuu kokeeseen, jossa koehenkilöiden syke on mitattu ensin levossa ja sitten minuutin juoksun jälkeen. Kuviossa ensimmäinen laatikko janoineen on luotu leposykkeen mittauksista. Toinen laatikko kuvaa mittauksia juoksun jälkeen. Levossa syke on yleensä lähellä 75:tä mutta juoksun jälkeen tyypillisesti lähellä 130:a (paksut poikkiviivat). Leposyke vaihtelee vähemmän kuin syke juoksun jälkeen: puolet leposykkeen havainnoista on välillä 70–83, mutta juoksun jälkeen puolet sykkeen mittauksista on välillä 110–145 (laatikoiden ala- ja yläreunat). Suurin sykkeen arvo on melkein 180.

Kuvio. Minuutin juoksun vaikutus sykkeeseen

Kuvio. Minuutin juoksun vaikutus sykkeeseen

Lähde StatSci.org [viitattu: 21.3.2016]. Saantitapa: http://www.statsci.org/data/oz/ms212.html

Esimerkissä näytetään laatikko-janakuvioita, joilla vertaillaan kolmen muuttujan arvoja.

Esimerkit

Jaa