
Johdatus tilastotieteeseen
2.2.9 Big data
Big data viittaa todella suuriin ja monimutkaisiin aineistoihin, joita on vaikea käsitellä perinteisillä tietotekniikan välineillä (lisätietoa Big datasta).
Esimerkkejä Big datasta ovat
- satelliittikuvat
- luottokortin käytöstä jäänyt informaatio
- automaattisten anturien tiedot liikenteestä, kuten yli kulkeneiden autojen lukumäärä tunnissa
- matkapuhelimen sijainnin seuraaminen: esimerkiksi Viron ja Hollannin tilastovirastot käyttävät väestön paikantamiseen teleoperaattorin antamia paikannusdatoja
- sosiaalinen media: yleisen mielialan ja aiheiden seuraaminen, esimerkiksi työn etsimiseen liittyvät haut Googlella saattavat ennakoida muutoksia työllisyydessä.
Suurimmat aineistot eivät edes mahdu tyypilliseen kotitietokoneeseen. Niiden hyödyntäminen edellyttää tilastollisia ja tietojenkäsittelyn menetelmiä, kuten koneoppimista ja tiedonlouhintaa.
Big dataa kerättäessä ei ole yleensä suunniteltu tarkkaan, mihin kaikkeen aineistoa voidaan käyttää. Joskus hyödyllisen informaation löytäminen tietomassasta on vaikeaa.
Lisälukemista tiedonkeruusta
- suomenkielinen artikkeli Big datasta.
- lisätietoa tiedonkeruusta Tilastojen ABC -kurssilta, 3.3 Tiedon hankinta.
- Tilastokeskuksen tiedonkeruu -sivusto
Testaa harjoitusten avulla, mitä muistat tiedonkeruusta.
EsimerkitHarjoituksetJaa