150 likes | 371 Views
Zaščita statističnih podatkov na SURS-u. Andreja Smukavec Sektor za splošno metodologijo in standarde. UVOD - 1. Zaščita : Andreja Smukavec, Erika Trpin, Manca Golmajer ( zascas.surs@gov.si ) .
E N D
Zaščita statističnih podatkov na SURS-u Andreja Smukavec Sektor za splošno metodologijo in standarde
UVOD - 1 • Zaščita: Andreja Smukavec, Erika Trpin, Manca Golmajer (zascas.surs@gov.si). • Zaupnost zagotavlja Zakon o državni statistiki (2001), Zakon o dostopu do informacij javnega značaja, Zakon o varstvu osebnih podatkov in evropska uredba št. 223/2009. • SURS želi podatke ustrezno zaščititi in hkrati izgubiti čim manj informacij.
UVOD - 2 • Vedno večje zahteve po statističnih podatkih. • Poročevalske enote želijo, da njihovi podatki ostanejo zaupni, zato hočemo preprečiti razkritje. • OVP = Odbor za varstvo podatkov (zunanji zahtevki, reševanje bolj kompleksnih vprašanj). • Dostop do mikropodatkov: varna soba, dostop z daljave, CD • Datoteke, ki jih hočejo raziskovalci izvoziti (varna soba, dostop z daljave) preverimo.
PODATKI ZA ZAŠČITO IN PROGRAMSKA OPREMA • Tabele: • frekvenčne tabele, vrednostne tabele; • τ-Argus. • Mikropodatki: • deindividualizirani; • namenjeni raziskovalcem (SUF); • namenjeni javnosti (PUF); - μ-Argus.
ZAŠČITA TABEL Metode za zaščito tabel: • agregacija; • metoda manjkajočih vrednosti: primarna zaščita (občutljive celice); sekundarna zaščita (ščiti občutljive celice); • druge.
Pravila za določanje primarno občutljivih celic: • prag t: celica je občutljiva, če k njeni vrednosti prispeva manj kot t poročevalskih enot; • pravilo dominantnosti (n, k): celica je občutljiva, če n poročevalskih enot prispeva k vrednosti celice več kot k %; • p%-pravilo: celica je občutljiva, če koalicija n vsiljivcev oceni največjo enoto z manj kot p%-no napako (ponavadi je n = 1, druga največja enota je vsiljivec); • pravilo zahteve
Pri zaščiti frekvenčnih tabel uporabljamo: • prag. Pri zaščiti vrednostnih tabel uporabljamo: • prag in pravilo dominantnosti; • prag in p%-pravilo; • pravilo zahteve.
Zaščita frekvenčne tabele (prag 5) ⇓ objava
Primer vrednostne tabeleŠtevilo zaposlenih po spolu, dejavnosti do oddelka (SKD 2008) in razredih neto plače
ZAŠČITA MIKROPODATKOV Določimo: • direktne identifikatorje (odstranimo); • ključne spremenljivke (identifikacija poročevalske enote); • občutljive spremenljivke. Metode za zaščito mikropodatkov: • dodajanje šuma; • zaokroževanje; • združevanje v (večje) razrede; • prag; • metoda manjkajočih vrednosti; • druge.