310 likes | 511 Views
Univerzitetni podiplomski študij Statistika Seminar Uradna statistika, marec 2003. DISEMINACIJA IN ZAŠČITA PODATKOV dr.Lea Bregar lea.bregar@uni-lj.si. DISEMINACIJA. Kaj je diseminacija Načela, funkcije, mediji, pogoji uresničevanja Diseminacija v Eurostatu. KAJ JE DISEMINACIJA.
E N D
Univerzitetni podiplomski študij StatistikaSeminar Uradna statistika, marec 2003 DISEMINACIJA IN ZAŠČITA PODATKOV dr.Lea Bregar lea.bregar@uni-lj.si
DISEMINACIJA • Kaj je diseminacija • Načela, funkcije, mediji, pogoji uresničevanja • Diseminacija v Eurostatu
KAJ JE DISEMINACIJA • Disemination (and publication) …making data available to the public (Handbook of Statistical Organisation, str. 128) • Dissemination is the release to users of information obtained through a statistical activity. (CODED, povzeto po Statistics Canada Quality Guidelines, str. 59)
NAČELA DISEMINACIJE • Statistični podatki kot javna dobrina • Enakost dostopa • Statistika v funkciji informiranja javnosti • Profesionalnost, neodvisnost, nepristranskost, objektivnost
FUNKCIJE DISEMINACIJE Zagotavljati uporabnikom informacije o: • razpoložljivosti podatkov z vsebinskega, lokacijskega in časovnega vidika • metodoloških osnovah • kvaliteti podatkov • povezanosti z drugimi podatki
NOVE OKOLIŠČINE URESNIČEVANJA FUNKCIJ DISEMINACIJE • tehnološke možnosti • paradigma: usmerjenost k uporabniku • vrednotenje informacij
MEDIJI DISEMINACIJE;UPORABNOST • Tradicionalni: tiskane publikacije • Elektronski (zgoščenke, Internet)
ELEMENTI UČINKOVITE DISEMINACIJE • Transparentna politika objavljanja podatkov • (pogoji in stroški pridobivanja podatkov) • Celosten koledar objav
EUROSTAT: NAČELA DISEMINACIJE • Prost dostop do osnovnih statističnih podatkov na Internetu • Komercialni proizvodi (standardni in po naročilu) • Sodelovanje (distribucija in založništvo) • Možnost sklepanja pogodb o avtorskih pravicah
EUROSTAT: DISEMINACIJA V PRAKSI • Spletna stran kot osnovni medij • E-prodaja podatkov • Baze podatkov • Publikacije • Koledar objav • Prve objave • Podpora medijem
ZAUPNOST IN VAROVANJE STATISTIČNIH PODATKOV • Pojmi in terminologija • Zaupnost v uradni statistiki • Ukrepi za varovanje zaupnosti • Pravni in etični • Organizacijski in administrativni • Statistično metodološki • Varovanje in dostopnost v praksi • Raziskave • Literatura
POJMI IN TERMINOLOGIJA • Privacy …the right to determine what information about ourselves we will share with others (Fellegi, 1972). • Privacy is a concept which applies to data subjects. • Confidentiality is the status acorded to data which has been agreed upon between the person or organisation furnishing data and the organisation receiving it and which describes the degree of protection which will be provided. (Dalenius,1988)
POJMI IN TERMINOLOGIJA • Data Confidentiality is a property of data, usually resulting from legislative measures, which prevents it from unauthorised disclosure. (CODED, UNECE; Terminology on Statistical Metadata)
POJMI IN TERMINOLOGIJA • Statistično razkritje (disclosure) se nanaša na razkritje statističnih podatkov o posamezni enoti. • Načini razkritja: • Povezovanje z drugim virom podatkov (matching) • Na osnovi poznavanja anketiranca • Spontana prepoznava
VAROVANJE ZAUPNOSTI STATISTIČNIH PODATKOV – VODILNA USMERITEV URADNIH STATISTIK • Nove tehnološke možnosti dostopa, shranjevanja, povezovanja, tabeliranja podatkov, vse več individualnih podatkov- vse večja nevarnost identifikacije individualnih enot ; • Možnost uporabe administrativnih podatkov v statistiki in njihovega povezovanja; • Decentralizacija dela statistikov in raziskovalcev; • Vse večji interes raziskovalcev za individualnimi podatki; • Vse večja nevarnost razkritja in zlorabe, izgube zaupanja, negativni zgledi v okolju.
ZASEBNOST, ZAUPNOST IN RAZKRITJE: OSNOVNA DILEMA • Kako definirati ravnovesje med interesi uporabnika za kvalitetnimi podatki in interesi dajalca podatkov, da zagotavlja zasebnost in zaupnost podatkov in preprečuje razkritje • Kako definirati optimalno strategijo SDC (Statistical Disclosure Control), upoštevajoč kriterij varnosti in izgubo informacij zaradi uporabe DSC- problem optimizacije.
UKREPI ZA VAROVANJE ZAUPNOSTI • Pravni in etični ukrepi • Organizacijski in administrativni ukrepi • Statistično metodološki (tehnični) ukrepi
PRAVNI IN ETIČNI UKREPI • Evropska zakonodaja : • Council Regulation 1588/90 pravica do zaupnih podatkov Eurostata • Council regulation 322/97 - Statistical Law • usklajena definicija zaupnosti in možnosti razkritja (pragmatičen pristop) • možnost raziskovalcev do zaupnih podatkov v posebnih pogojih • Committe on Statistical Confidentiality • Administrativni in statistični podatki: asimetričnost uporabe
PRAVNI IN ETIČNI UKREPISLOVENIJA • Zakon o varstvu osebnih podatkov podatkov (8. julij 1999) • Zakon o državni statistiki (Ur. list RS št. 45 – 2169/1995 in Ur. list RS št. 9 – 529/2001)
ZAŠČITA STATISTIČNIH PODATKOVSLOVENIJA • Osebni podatki se lahko zbirajo na osnovi zakona ali pa po Programu statističnih raziskovanj; • Za namene anketiranja sme urad posredovati registriranim ustanovam samo naslednje podatke: ime in priimek posameznika, njegovo prebivališče, leto rojstva, spol , poklic. • Zavarovanje statističnih podatkov obsega tehnične ukrepe in organizacijske ukrepe ter druge logično tehnične postopke, za varovanje prostorov, opreme, varnosti pri posredovanju podatkov itd.
ZAŠČITA STATISTIČNIH PODATKOVSLOVENIJA • Zaposlene osebe in pogodbeno angažirane osebe so dolžne kot uradno tajnost varovati vsebino individualnih podatkov (tudi po prenehanju delovnega razmerja). • Urad lahko medsebojno povezuje vse podatke iz zbirk osebnih podatkov, določenih s PSR. • Pravice do varstva po ZVOP ima posameznik kadar je podatke dobil Urad od njega neposredno; kadar se taki podatki zbirajo posredno, posameznika o tem ni treba posebej obveščati.
ORGANIZACIJSKI IN ADMINISTRATIVNI UKREPI Opredeljujejo (omejen ali neomejen odnos) prejemnikov podatkov do dostopnosti podatkov. • Posebej pooblaščeni zaposleni (specially sworn employees) ali pa zunanji uporabniki (raziskovalci) • Kontrolirani pogoji • Sporazumi po licenci (licensing agreement) • Posebne pogodbe • Panelni pregledi (review panel) • Pooblaščene tretje osebe (trusted third parties)
KLASIFIKACIJA SPREMENLJIVK V SDC • Kategorialne spremenljivke • Hierarhične spremenljivke • Kvantitativne (zvezne, numerične) spremenljivke • Identifikacijske spremenljivke
STATISTIČNO METODOLOŠKI (TEHNIČNI) UKREPI ZA VAROVANJE MIKRO PODATKOV • Delno prekodiranje (Local Recoding) • Globalno prekodiranje (Global Recoding) • Delno izpuščanje (Local Suppression) • Delno izpuščanje z imputiranjem • Sintetični mikropodatki in večkratno imputiranje • Podvzorčenje (Subsampling) • Dodajanje šumov (Adding Noise) • Zaokroževanje • Mikroagregacija • PRAM (Post Randomisation Method) • Zamenjevanje podatkov (Data Swapping)
STATISTIČNO METODOLOŠKI (TEHNIČNI) UKREPI ZA VAROVANJE PODATKOV v TABELAH • Preoblikovanje tabel (Table Redesign) • Izpuščanje podatkov (Cell Supression) • Dodajanje šumov (Adding Noise) • Zaokroževanje (Rounding) • Perturbacija virov (Source Data Perturbation)
DOSTOPNOST RAZISKOVALCEV DO INDIVIDUALNIH PODATKOV V PRAKSI • Questionnaire on on Disclosure and Confidentiality – Sumary and Replies; CES, Joint ECE/Eurostat Work Session on Statistical Confidentiality, Greece, March 1999, Working paper No.27 (glej prilogo)
DOSTOPNOST RAZISKOVALCEV DO INDIVIDUALNIH PODATKOV: NEKAJ PRIMEROV DOBRE PRAKSE • Research Data Centres v Nemčiji (dostopnost do PUF - Public use Files and SUF - Scientific use Files; nadzorovana obdelava na daljavo; varne sobe; svetovalni center) • UK Data Archive • University of Essex
RAZISKAVE NA PODROČJU VAROVANJA PODATKOV • SDC (Statistical Disclosure Control) (Willenborg, Bled, 1996) • Argus (Giessing, Skopje, 2001) • CASC- Computational aspects of Statistical Confidentiality (Hundepool, Statistical Journal of UN ECE 18 (2001), str. 315 – 320.
LITERATURA • Willenborg L. in De Waal T.: Elements of Statistical Disclosure Control. Springer, Lecture Notes in Statistics št. 155, 2000, str.261.. • Willenborg L. in De Waal T: Disclosure Control in Practice. Springer, Lecture Notes in statitics št.111, 1996,str.152. • Manual on Disclosure Control Methods, Eurostat, 1996, str. 87. • Konference CES: Dissemination and interchange of statistical information
LITERATURA International seminar on statistical confidentiality - Proceedings of 8 to 10 September 1992, Dublin, Ireland;Eurostat [Theme: Science & Technology] International seminar on statistical confidentiality. Proceedings - 28 to 30 November 1994, Luxembourg Eurostat, [Theme: Science & Technology] Statistical data protection - Proceedings of the conference, Lisbon, 25 to 27 March 1998 - 1999 edition , Eurostat, [Theme: Science & Technology]
LITERATURA • Conference of European Statisticians Marec 1999, Work Session on Statistical Data Confidentiality Marec 2001, Work Session on Statistical Data Confidentiality April 2003, Work Session on Statistical Data Confidentiality • Fellegi I.P: On the Question of Statistical Confidentiality, JASA, March 1972, Volume 67, Number 337, Application Section • Dalenius T.: Controlling Invasion of Privacy in Surveys. Statistics Sweden, 1988.