På svenska

In English

Johdatus tilastotieteeseen

Oppitunti:
Aihe:

2.2.9 Big data

Big data viittaa todella suuriin ja monimutkaisiin aineistoihin, joita on vaikea käsitellä perinteisillä tietotekniikan välineillä (lisätietoa).

Esimerkkejä Big datasta ovat

  • satelliittikuvat
  • luottokortin käytöstä jäänyt informaatio
  • automaattisten anturien tiedot liikenteestä, kuten yli kulkeneiden autojen lukumäärä tunnissa
  • matkapuhelimen sijainnin seuraaminen: esimerkiksi Viron ja Hollannin tilastovirastot käyttävät väestön paikantamiseen teleoperaattorin antamia paikannusdatoja (lisätietoa)
  • sosiaalinen media: yleisen mielialan ja aiheiden seuraaminen, esimerkiksi työn etsimiseen liittyvät haut Googlella saattavat ennakoida muutoksia työllisyydessä.

Suurimmat aineistot eivät edes mahdu tyypilliseen kotitietokoneeseen. Niiden hyödyntäminen edellyttää tilastollisia ja tietojenkäsittelyn menetelmiä, kuten koneoppimista ja tiedonlouhintaa.

Big dataa kerättäessä ei ole yleensä suunniteltu tarkkaan, mihin kaikkeen aineistoa voidaan käyttää. Joskus hyödyllisen informaation löytäminen tietomassasta on vaikeaa.

Lisälukemista tiedonkeruusta

Testaa harjoitusten avulla, mitä muistat tiedonkeruusta. 

Esimerkit Harjoitukset

Jaa