På svenska

In English

Johdatus tilastotieteeseen

Oppitunti:
Aihe:

2.2.4 Vastauskato 

Väestöä koskeva otostutkimus tehdään yleensä haastattelemalla otokseen valittuja henkilöitä puhelimitse tai käymällä henkilön luona. Kaikilta ei saada vastausta, sillä joitakin henkilöitä ei koskaan tavoiteta ja monet kieltäytyvät vastaamasta. Tätä kutsutaan vastauskadoksi.

Vastauskato on yleistynyt koko maailmassa viime vuosina. Monessa otostutkimuksessa vastaus jää saamatta 30–40 % otoksen henkilöistä (ks. lisätietoa Public Opinion Quarterly -julkaisusta). 

Miksi vastauskato on haitallista? Lopullinen estimointi perustuu vain vastanneisiin henkilöihin, joita on vastauskadon vuoksi vähemmän. Silloin virhemarginaali kasvaa ja luottamusvälit levenevät. Vielä haitallisempaa on, jos vastaamatta jättäneet henkilöt olisivat antaneet erilaisia vastauksia kuin haastattelussa vastanneet henkilöt.

Tarkastellaan esimerkkinä keskimääräisten asumismenojen estimointia. Vastauskato on haitallista, jos suurten asuntojen omistajat jättävät muita useammin vastaamatta, sillä heidän asumiskulunsa ovat keskimääräistä suurempia. Silloin vastanneiden henkilöiden asumiskulut ovat keskimäärin pienempiä kuin perusjoukossa. Otoksesta estimoidut keskimääräiset asumiskulut jäävät liian pieneksi eli perusjoukon keskiarvon estimaattori on harhainen.

Harhaiseen estimaattorin perustuva luottamusväli saattaa olla täysin epäluotettava. Jos estimaatti on mahdollisesti kaukana parametrista, annettu luottamustaso ei anna oikeaa kuvaa virheen riskistä. Todellinen virheen riski saattaa olla paljon suurempi (jopa yli 90 %) kuin luottamustason mukainen nimellinen riski (5 %). Otoskoon kasvattaminen vain kaventaisi luottamusväliä, mutta siitä ei ole luottamusvälin todellisen luotettavuuden kannalta mitään hyötyä. Käytännössä estimaattorin harhan suuruutta on vaikea arvioida.

Yksityisyyden varjelu on yksi perustelu jättää vastaamatta. Tilastokeskuksen otostutkimukseen vastaaminen ei vaaranna henkilön yksityisyyttä. Tilastokeskuksen otostutkimukset ovat luottamuksellisia: julkaistuista tilastoista tai tutkimuksista ei voi tunnistaa yksittäisen henkilön tai yrityksen vastauksia.

Harjoitukset

Jaa