250 likes | 365 Views
Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában. Szép Katalin – Gadácsi Katalin KSH Fényes Elek Műhely 2010. május 26. Vázlat. Alapok: statisztikai cél Adatkiadás, kockázatok, csatornák Alapelvek Dilemmák Eurostat gyakorlat, fejlesztési irányok
E N D
Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában Szép Katalin – Gadácsi Katalin KSH Fényes Elek Műhely 2010. május 26.
Vázlat • Alapok: statisztikai cél • Adatkiadás, kockázatok, csatornák • Alapelvek • Dilemmák • Eurostat gyakorlat, fejlesztési irányok • Záró gondolatok
Milyen adatok vannak? „ 2008-ban XYZ Kft. nettó árbevétele 345678 ezer Ft ” • Adóbevallás – adminisztratív adat • KSH kérdőív – statisztikai adat • …
Mitől függ? Minden esetben adott egységre vonatkozik, de a cél különbözik: • Igazgatási/adminisztratív –felhasználása közvetlenül az adott egységet érinti, adott egységre vonatkozó intézkedések alapja • Statisztikai – sokaságot akarjuk jellemezni.
Adatgyűjtés – feldolgozás - használat Adminisztratív cél Adatgyűjtés Ellenőrzés, Egységet érintő nyilvántartás intézkedés Statisztikai cél Adatgyűjtés Adatellenőrzés,ösz- Sokaságot szesítés, becslésjellemző adat
Adatgyűjtés – feldolgozás - használat Adminisztratív cél Adatgyűjtés Ellenőrzés, Egységet érintő nyilvántartás intézkedés Statisztikai cél Adatgyűjtés Adatellenőrzés,ösz- Sokaságot szesítés, becslés jellemző adat
Egy speciális kérdés: adat-összekapcsolás • Célok • Költségcsökkentés • Adatszolgáltatói terheket ne növeljük • Meglévő adatokból max információ kinyerése • Megoldás: adatösszekapcsolás • Kapcsolás a lehető legpontosabb adatokból • Összekapcsolt állomány gondos anonimizálása (kapcsolás előtti anonimizálás rontja a kapcsolás minőségét, és nem biztos, hogy anonim kapcsolt állományt eredményez)
EU Statisztikai Rendszer jövőképe Cél: adatszolgáltatói terhek mérséklése, minőség javítása Statisztikai elemzések Feldolgozás Különböző adatforrások Forrás: Communication from the Commission to the European Parliament and the Council …COM(2009)404. 8. August 2009
Statisztikai célból gyűjtött/kezelt adat csak statisztikai célra használható, azaz a sokaság jellemzésére. Adatkiadáskor adminisztratív célra alkalmatlanná kell tenni, azaz ne legyen alkalmas egyedek azonosítására, egyedekre vonatkozó információ felfedésére.
Milyen információ felfedését akadályozzuk meg? • Ország kultúrájától függ. • Magyarországon: • különleges adat (jogi alap) • érzékeny adat (vállalati, lakossági kultúra)
Felfedés elleni védelem • Felfedés kockázata függ: • Adat jellege (érzékeny, különleges+közvetlen és közvetett azonosítást lehetővé tevő) • Adathasználat közvetlen célja, adathasználó rendelkezésére álló egyéb információ, eszközök, nyilvántartás, adathasználó háttérintézményének feladata • Jogi védelem lehetősége • Adatvédelem: felfedés elleni logikai, jogi, fizikai védelem • Tökéletes védelem nincs, cél, hogy szokásos idő és eszközráfordítással ne legyen felfedhető
Felfedés tipikus esetei - Táblázatból • Ha az érzékeny kategóriába túl kevés adatszolgáltató esik pl. személygépkocsi-gyártás megyei adatai • Ha az érzékeny kategóriába túl sok/összes adatszolgáltató esik pl. „B régióban minden hajótulajdonos környezetszennyező” Védelem: aggregálás, cellaelnyomás, kerekítés
Felfedés tipikus esetei - Mikroadatokból • Közvetlen azonosítókból (név, telephely, adószám) • Ritka értékkombinációkból (főtevékenység, régió, létszámkategória) Védelem: közvetlen azonosítók törlése, csonkolás, cellaelnyomás, átkódolás-kerekítés, összekeverés
Eurostat Statisztikai Hivatal Jogi védelem a) b) c) c) b) a) Kutatók az Eurostat kutató-szobájában Kutatók a Hivatal kutató-szobájában EU-s mikroadatot használó kutatók Hazai mikroadatot használó kutatók Nyilvánosság Főbb adatkiadási csatornák a KSH-ban Felfedés elleni védelem a) aggregált és mikroadatok nyilvánosságra hozása b) anonimizált mikroadatkiadás (kutatási célra) c) mikroadat-hozzáférés
Adatkiadási/hozzáférési csatornák • Táblázatos • Kész táblázatok (kiadványok, Stadat vagy egyedi) • Adatbázisokból lekérdezéssel • Mikroadat • Távoli hozzáférés • Kutatószoba • Adatállomány kiadása (kutatónak, v. publikus) • Adatállomány átadása kutatói adatbázisba
Felfedés elleni védelem alapelvei • Maximális biztonság – minimális kockázat • Minimális információveszteség • Hatékonyság, összehangoltság • Megalapozottság Különböző formában, különböző csatornákon Egyenkockázat elve
Dilemmák az adatkiadásban • Felhasználók megkülönböztetése – egyenkockázat elve • Egyedi igényeknek megfelelő anonimizálás – kockázatnövekedés - erőforrásigény - ingyenesség
EU: bizalmas adatokhoz való tudományos célú hozzáférés Bizottság 831/2002/EK rendelete Bizalmas adatok – statisztikai egység közvetlen azonosíthatóság nélkül Bizalmas adatokhoz való hozzáférés – hivatali helységben, vagy anonimizált mikroadat kiadása Kérelem: • Intézmény (egyetem, tudományos kutatóintézet, statisztikai intézet, EKB, jegybankok) Bizottság 2004/452/EK határozata a szervezetek jegyzékéről • Kutatók • Kutatási cél • Adatállomány
Fejlesztési irányok a világban • Nemzetközi összehasonlítási igény, lehetőség • Új technikai lehetőségek (távoli hozzáférés, adatbázisok mérete, hozzáférési eszközök, adatelemzési eszközök) • Speciális kérések, kérdések Válaszok: kutatás, fejlesztés a felfedés elleni logikai védelemben, informatikai, jogi eszközökben
Adatvédelmi fejlesztések az EU-ban • Adatvédelmi kézikönyv felülvizsgálata • érthetőség • Hozzáférés mikroadatokhoz EU szinten (Eurostaton keresztül) • Intézményi engedélyeztetés egyszerűsítése • Adatállományok bővítése • Hozzáférés kutatószobák hálózatán keresztül • Kutatószobák standardja • Anonimizálás, felhasználók minősítése, dokumentáció, szerződés standardja • Szabályozás standardizálása
Fejlesztések a KSH-ban • Részvétel EU grantokban/fejlesztésekben • Adathozzáférési csatornák bővítése • Adatvédelmi szempontok egységesítése Csökkenő pénzügyi erőforrások, igen korlátozott emberi kapacitások mellett.
Összegzés (1) Statisztikai célokat szolgáló adat csak úgy adható ki (statisztikai szolgálaton kívülre), hogy ne szolgálhasson közvetlenül adminisztratív intézkedés alapjául. Eszköz: felfedés elleni logikai, technikai, jogi védelem Kiadható anonimizált mikroadat, biztonságos táblázat.
Összegzés (2) • Statisztikai célnak való megfelelés • Befogadhat egyedi adatot • Kiad csak anonimizált adatot • Mikroadatkiadáshoz • Termelési folyamat átalakítása • Módszertani felkészülés • Költség és emberi erőforrásigény • Jogi környezet (koncepcionális összhang, EU konformitás)
Köszönöm a figyelmet! katalin.szep@ksh.hu