Tutkimusaineistot etäkäytössä

Oppitunti:
Aihe:

3.3.2 Taulukkoaineistojen suojausmenetelmät

Taulukon suojausprosessin toisessa vaiheessa herkät solut suojataan valitulla suojausmenetelmällä. Suojausmenetelmän valinnassa tärkeimmät kriteerit ovat vaaditun suojaustason saavuttaminen ja taulukon tärkeiden ominaisuuksien säilyttäminen. Näin taulukko tulee suojattua riittävästi, mutta on hyödyllinen suojauksen jälkeenkin.

Usein menetelmän valintaan vaikuttaa eniten käytettävissä olevat resurssit, kuten aika ja saatavilla oleva ohjelmisto, jolla suojaus toteutetaan. Suojausmenetelmän tulisi olla myös läpinäkyvä siten, että suojatun taulukon käyttäjä ymmärtää käytetyn suojausmenetelmän pääpiirteet ja näin osaa ottaa huomioon suojauksen mahdollisesti aiheuttamat muutokset taulukossa.

Taulukoiden suojausmenetelmänä käytetään yleensä peittämistä tai  luokituksen muuttamista 

  • Peittämiseen kuuluu ensisijainen, paljastumisriskissä olevien solujen peittäminen ja toissijainen peittäminen. Toissijaisella peittämisellä varmistetaan, ettei taulukon rivi- tai saraketotaalien avulla pystytä paljastamaan ensisijaisesti peitettyjen solujen arvoja. Peittäminen voidaan tehdä myös rivikohtaisesti. Jos taulukon johonkin rivitotaaliin kuuluu vain pieni määrä tilastoyksiköitä (vähemmän kuin käytetty kynnysarvo), peitetään kyseinen rivi kokonaisuudessaan huomioimatta sen eri soluissa olevien tilastoyksiköiden lukumäärää.
  • Luokitusta muuttamalla taulukosta pyritään hävittämään paljastumisriskissä olevat solut yhdistämällä niitä sisältävät luokat muihin taulukon luokkiin. Luokituksen muuttaminen tarkoittaa usein käytännössä koko luokituksen karkeistamista.

Taulukoiden suojausmenetelmänä voidaan käyttää myös paljastumisriskissä olevien solujen arvojen muuttamista. Tällaisia menetelmiä ovat esimerkiksi pyöristäminen ja alkuperäisen soluarvon korvaaminen likimääräisellä satunnaisluvulla.

Taulukoiden ja muuntyyppisten tulosteiden suojaus etäkäyttöjärjestelmässä tarkoittaa käytännössä sitä, että tarkastukseen lähetettäviin tulosteisiin ja taulukoihin ei kohdistu paljastumisriskiä. Tutkijan on siis toteutettava suojaus käyttämällä tarpeeksi karkeita luokituksia tai muuten suunnittelemalla tulosteiden sisältö tietosuojan kannalta hyväksyttäväksi. Tarkemmin tutkimustulosten suojaamisesta ja tarkistusmenettelystä on kerrottu aiheessa 3.4 Tutkimustulosten suojaaminen ja tarkistusmenettely.

Alla olevan esimerkin ja harjoitustehtävän avulla voi pohtia lisää taulukkoaineiston suojaukseen liittyviä käytännön haasteita.

EsimerkitHarjoitukset

Jaa