300 likes | 496 Views
Mikrodata til forskere. Paul Inge Severeide Statistisk sentralbyrå. Innhold. Rammebetingelser Kort om oppdragsporteføljen i dag Mål og status Oppsummering. Lov og strategi. Statistikkloven § 3-1 d)
E N D
Mikrodata til forskere Paul Inge Severeide Statistisk sentralbyrå
Innhold • Rammebetingelser • Kort om oppdragsporteføljen i dag • Mål og status • Oppsummering
Lov og strategi • Statistikkloven § 3-1 d) • SSB skal ”gi opplysninger til statistisk bruk for forskningsformål og for offentlig planlegging innenfor rammen av denne lovs § 2-5”. • Strategiplan • Vi skal gjøre egne data tilgjengelig for forskningsformål både i og utenfor SSB
Utlån av mikrodata til forskning § 2-5 Begrenset bruk av opplysningene Hovedregel: bare brukes til utarbeidelse av offisiell statistikk unntak: annen bruk som er godkjent av Datatilsynet • utlån av opplysninger til forskning og off.planlegging jf stl § 3-1 d) og Datatilsynets vedtak 16.03.2006
Identifiserbar Anonym Ikke-publiserbar Utlån off.planlegging stl § 2-5 Taushetsplikt stl § 2-4 Mikrodata Ikke-publiserbar Utlån forskning stl § 2-5 Publiserbar stl § 2-6 Statistikk • utlevering av data til forskning
Forskertjeneste i SSB • Utlevering av data til Forskning (registerdata) • Intervjuundersøkelser utført av SSB - formidling gjennom NSD • Trekking av utvalg for andre Kombinasjoner av disse
Gode registerdata i Norge • I verdenstoppen, sammen med de andre nordiske land. Mye data - gode data • Gode rammebetingelser • Lang erfaring med registre som grunnlag for statistikkproduksjon • Aktivt samarbeid med registereiere (Statistikklovens §3-2) • Offentlige myndigheter inkl. Datatilsynet anerkjenner bruk av registerdata i forskning • Utvikling i retning av mer og bedre data...
Statistical system in Norway Dwelling address project Improve data quality dwelling register Labour market Social security. Matrikkel Income CPR Education Dwellings Buildings Families Couples Households Persons Dwellings Develop register-based statistics Questionnaires Families and households Develop register-based statistics
Litt om dagens oppdragsportefølje • Mange oppdrag av ulik karakter og ulik omfang • Den sentrale oppdragsenheten utfører i snitt vel 300 betalte oppdrag i året. De fleste av disse er forskeroppdrag • Om lag 40 oppdrag fra ”FD-trygd basen” • I tillegg utfører den enkelte fagseksjon i snitt ca 10 oppdrag i året
Tilbakemelding fra brukere • Generelt god tillit til SSBs faglige kompetanse og positiv til satsing på å bygge opp en effektiv formidlingstjeneste • Kritikk på punkter som • Informasjon om datakilder • Kødannelse • Omstendelig regelverk for tilgang på mikrodata • Ulik prising av oppdrag • Gjenbruk av data
NFR rapport fra 2003 • Betingelsene for forskning basert på registerdata er gode i Norge (vi har mye data og gode data) • Samfunnsnyttig å bygge opp en god infrastruktur • Kjennetegn ved en god infrastruktur • Oversikt over datakilder og hva de inneholder • Standardiserte datasett – enkelt å hente ut • Effektive bestillings- og utleveringsrutiner • Alternative metoder for tilgang til data tilpasset forskerens databehov og innefor gjeldende regelverk. • Arkivering • Kontakt og tilbakemelding fra forskere
Overordnet mål Vi skal gi alle typer forskere, inkludert studenter, lettest mulig tilgang til flest mulig av SSBs data innenfor det regelverk som gjelder
Dokumentasjon og informasjon Det må være kjent hva slags datakilder som eksisterer og er tilgjengelige for forskning, og det må være kjent hva de ulike datakildene inneholder.
Status i SSB • Det er etablert en nettbasert informasjonsportal i SSB med informasjon og dokumentasjon om aktuelle registerdatakilder, samt informasjon om forutsetninger og regler for utlevering av mikrodata til forskning (Data til forskning) • Nettsiden er ikke komplett, enda • Gode tilbakemeldinger fra forskere som bruker den, men er den godt nok kjent?
Standardisering • De sentrale datakildene for forskning må være standardisert og samordnet slik at data til ulike forskningsoppdrag kan tas ut på en rasjonell og effektiv måte. • Konsistenskontroll, kvalitetssjekk og samordning på områder hvor forskningen har særlige behov • Etablere spesielt bearbeidede og tilrettelaget datasett for forskningsformål
Status i SSB • Konsistenskontroll, både på mikro, og makronivå, er en del av den ordinære statistikkproduksjonen, men er det tilstrekkelig for forskningsformål? • Tilbakemeldinger fra forskere på bruk av dataene er en viktig kilde – vi bør systematisere denne tilbakemeldingen bedre • For å øke effektiviteten i formidlingen av data til forskere er det etablert flere spesielt tilrettelagte datafiler med koplede mikrodata
Samordning – interne rutiner • Det må være effektive bestillings- og utleveringsrutiner som sikrer rask tilgang til data til forskere, samtidig som hensynet til registereiere og personvern ivaretas på en forsvarlig måte. • Virksomheten i SSB må være samordnet og basert på en felles forståelse. Forskerne må ha lett tilgang til fagekspertisen på aktuelle fagseksjoner.
Status i SSB • Sentral oppdragsenhet med ansvar for koordinering av tverrgående oppdrag – en telefonlinje inn • Prosessbeskrivelse utarbeidet for å sikre samordning internt • Likevel utfordring ndg prioritering mellom forskeroppdrag og statistikkproduksjon • Bestillings/utleveringsrutiner internt er forbedret, men betydelig tidstap i de formelle eksterne godkjenningsprosedyrene…
Taushetsplikten.... Forvaltningsloven § 13 d • Taushetsplikten forhindrer dataeier å gi opplysningene til forskeren. • Forskeren kan søke overordnet dept (noen tilfeller delegert til direktorat), om tilgang til dataene for et konkret prosjekt • Dataeier gis da dispensasjon fra taushetsplikten, slik at de kan utlevere til forskeren • Forskeren vil pålegges (samme) taushetsplikt ved behandling av opplysningene
13 SSB SkD SSB NAV SSB SSB SSB SSB BLD POD NSD NAV NAV Datatilsynet DÅR v/330 REK Personvernnemd FHI REK • utlevering av data til forskning DISP FRA TAUSHET SÆRSKILT TILLATELSE DATA SØKNAD TIL 1 5 Bereg 6 FD-trygd Inntekt 13 Etisk komité 7 Barnevern 8 Trafikkulykker 10 2 11 Diagnose 9 3 12 Dødsårsak 4 Reseptreg
Tilgang til data Det må eksistere alternative metoder for tilgang til data tilpasset forskerens databehov innenfor gjeldende regelverk
Status i SSB • Mikrodata utleveres vanligvis i form av en CD til den enkelte forsker/forskningsinstitusjon etter at dataene er avidentifisert/anonymisert og lovmessige krav er oppfylt. • Det er gjennomført et prosjekt som har vurdert alternative metoder. • Konsentrerer nå arbeidet om å etablere en remote access løsning (forskerne får ikke fysisk tilgang til data) – planlegging i høst, gjennomføring i 2011 • Det er etablert et system for formidling av data til offentlig planlegging basert på dette prinsippet (super cross)
Arkivering Det må finnes et arkivsystem som sikrer mulighetene for gjenbruk av data som er utlånt til forskningsformål.
Status i SSB • For data som utleveres etter spesialbestilling fra forskere, eksisterer det i dag ingen generelle rutiner for arkivering av data eller programmer og prosedyrer som ble brukt i konstruksjonen av datasettene. • Et prosjekt er gjennomført med forslag til opplegg for arkivering av data som er utlevert til forskere • Dette arbeidet følges opp i vår med mål: utarbeide kravspesifikasjoner – implementering i løpet av 2010/2011
Kontakt med forskere Det må være systematisk kontakt mellom forsker og dataformidler for å sikre en best mulig brukertilpasset formidlingstjeneste
Status i SSB • Vi gjennomførte flere brukerseminarer i arbeidet med å etablere nettsiden ”Data til forskere”. I tillegg er det gjennomført et par brukerseminar for å få innspill til vår generelle mikrodatatjeneste • Enkeltforskere er invitert til samtaler om tjenesten. Gjennomgang av konkrete oppdrag – hva gikk bra, hva bør gjøres bedre? • Daglig kontakt gjennom de konkrete forsker- oppdrag
Norsk Samfunnsvitenskapelig Datatjeneste (NSD) Det skal være hensiktsmessige samarbeidsrelasjoner mellom SSB og NSD til beste for norsk forskning
Status i SSB • Tett kontakt og mye dataflyt mellom SSB og NSD - et unikt samarbeid internasjonalt • Ny avtale skal utarbeides – NSD blir databehandler for SSB • Samarbeidsprosjekt pågår: Et utvalg FD-trygd data (inkl utdanning og inntekt) skal overføres til NSD for videreformidling til studenter/forskere
Oppsummering av planer • Forbedret infrastruktur • Databeredskap som gir mer effektiv utlevering • Felles prosessbeskrivelse for tjenesten som sikrer god flyt og likebehandling • Innføring av ”remote access” som tilgangskanal • Bedre informasjon og mer dokumentasjon • Forskere skal vite hvilke data- og om dataene • Arkiveringssystem som sikrer mer effektiv gjenbruk av data • Samarbeid med NSD for å optimalisere tjenesten