Tilastojen ABC

Oppitunti:
Aihe:
Esimerkki 1 2 3 4

Otoksen koko ja estimaattien tarkkuus

Kun tutkimuksen otos on koottu satunnaisesti, otoksen tai siitä lohkottujen näytteiden koko vaikuttaa siihen, miten tarkkoja estimaatteja perusjoukosta voidaan esittää. Tilastollisten testien avulla selvitetään satunnaisvirheen merkitys aineistossa ja tuloksena on aineiston estimaateille lasketut luottamusvälit eli niin sanotut virhemarginaalit..

Kokolailla yleisesti käytetyksi normiksi on muodostunut, että luottamusvälit (virhemarginaalit) määritellään 95 prosentin todennäköisyydellä. Se tarkoittaa, että saatu tulos on 95 prosentin todennäköisyydellä annetun virhemarginaalin rajojen sisäpuolella. Yksinkertaistaen: jos tutkimus toistettaisiin 100 kertaa, 95 kerralla tulos osuisi virhemarginaalin sisään ja 5 kerralla sen ulkopuolelle.

Tällä tavoin laskien on saatu aikaiseksi mielipidetutkimusten yhteydessä esitetyt prosenttilukujen virhemarginaalit. Kun otoksen koko on noin 1 000, on virhemarginaali 95 prosentin todennäköisyydellä +/- 2–3 prosenttiyksikköä (usein käytetään ilmaisua 2–3 prosenttiyksikköä suuntaansa). Kun otoskoko kolminkertaistetaan, virhemarginaali pienenee +/- 1–2 prosenttiyksikköön. Vastaavasti jos otosta pienennetään 500:aan, virhemarginaali voi olla lähes 10 prosenttiyksikön suuruinen. Tarkkaan ottaen tilanne on monimutkaisempi: virhemarginaalit vaihtelevat esimerkiksi sen mukaan, kuinka suuresta prosenttiosuudesta on kysymys.

Virhemarginaalit on edellä laskettu prosenttiosuuksia kuvaaville tuloksille, mutta myös muille aineistoa kuvaaville tunnusluvuille voidaan esittää virhemarginaalit. Tällaisia tunnuslukuja ovat muun muassa keskiarvo ja keskihajonta.

Virhemarginaali kasvaa, kun aineistoa lohkotaan: jos tuhannen hengen otoksesta esitetään tietoja, jotka kuvaavat erikseen miesten ja naisten ominaisuuksia, sukupuolittain lasketut ovat estimaatit epävarmempia kuin koko otoksesta esitetyt.

Takaisin oppimateriaaliin