140 likes | 296 Views
SURS: ZBIRANJE IN UREJANJE STATISTIČNIH PODATKOV mag. Pavle Kozjek S ektor za informacijsko tehnologijo in infrastrukturo - S lužba za razvoj aplikacij za zbiranje in urejanje podatkov. Uvod. Zbiranje in urejanje statističnih podatkov: vhod v statistični proces
E N D
SURS: ZBIRANJE IN UREJANJE STATISTIČNIH PODATKOVmag. Pavle KozjekSektor za informacijsko tehnologijo in infrastrukturo- Služba za razvoj aplikacij za zbiranje in urejanje podatkov
Uvod • Zbiranje in urejanje statističnih podatkov: vhod v statistični proces • Informacijski sistem Statističnega urada RS: postopen prehod z okolja osrednjega računalnika na lokalno omrežje - priložnost za prenovo podsistema za zbiranje in urejanje podatkov • Cilj: integriran podsistem s standardiziranimi rešitvami • Pomen fleksibilnosti: • podpora obstoječim aplikacijam tudi v novem okolju • možnost nadaljnjega vključevanje novih metod in tehnik zbiranja in urejanja podatkov
Shema 1: Tok podatkov in metapodatkov v procesu statističnega raziskovanja (Sundgren, 1999)
On-line CD CD xls,tpl,txt datoteke xls,tpl,txt datoteke CD Procesiranje podatkov na SURS in uporabljena orodja (zbiranje in urejanje podatkov) Globalni metapodatki, vključno s klasifikacijami in šifranti KONČNE VEČDIMENZIONALNE STATISTIKE SUROVI PODATKI ČISTI KONČNI PODATKI kazala Katalogi vsebine KONČNI UPORABNIKI El .dok. DW OLAP Publ. tabele • Osrednji računalnik: • VSAM datoteke, Cobol, PL-1 • DBMS Rapid,Godar REGISTRI • Lokalno omrežje: • Blaise,VB • Edisent • SAS
VIRI PRIPRAVA PODATKOV STATISTIČNE OBDELAVE DISEMINACIJA P O Ž A R N A S T E N A A R H I V podatkov in procesov A R H I V podatkov in procesov A R H I V podatkov in procesov URADNI A R H I V PREVZEM OD URADNIH USANOV ZGOLJ ZA OBJAVO Vhodni register kazala Vhodni register Katalogi vsebine Vhodni register Mikro Podatki OLAP Disemi- nacijski strežnik Vhodni statistični register STATISTIČNA KONTROLA, ANALIZE IMPUTACIJE, PREFORMACIJE POROČANJE SEKUNDA- RNIH VIROV EKSTRAKCIJA, ZAUPNOST ANALIZE, AGREGACIJE, OCENJEVANJA Publikacije Mikro baza Makro baza PRIDOBIVANJE PODATKOV EKSTRAHIRANJE PODATKOV DISEMINACIJA Podatki Iz virov ZUNANJI UPORABNIKI Elektronsko izmenjevanje podatkov Vhodna baza • RAZVIJALCI: • RDBMS Oracle ,Pl-SQL • Designer,Developer, • SAS, MS Access,TPL, TPL • MS SQL OLAP • STATISTIKI/ • RAZVIJALCI • SAS POROČANJE PRIMARNIH VIROV Podatkovno skladišče Internet UREJANJE PODATKOV • RAZVIJALCI: • MS SQL,IIS, Visual Interdev • PC-Axis • RAZVIJALCI - HOST: • Cobol,TPL, Rapid, BO • DBMS Oracle, SQL • TISKARNA: • Corel Draw • Photoshop (psp) • Pagemaker, • Framemaker • Ventura • MS Office • …. • UPORABNIKI: • Oracle Discoverer • MS Access, Excel,Word • SAS • MS SQL OLAP METIS • UPORABNIKI • PC-Axis orodja • Beta - host (interno) • BSP -host Dokumentacija v izdelanih šablonah KLASJE • RAZVIJALCI: • DMBS Oracle, PL-SQL • Designer,Developer, • MS Access, MS SQL,IIS,Visual Int. UREJANJE DOKUMENTACIJE UREJANJE METAPODATKOV • GIS: • Imagine (sat.) • ArcInfo, MapInfo • Idrisi PRIPRAVLJANJE: METODOLOGIJE, OKVIRJA, STAT. GRADIVA, VPRAŠALNIKA Z VPRAŠANJI, OBJEKTOV OPAZOVANJA, STAT. SPREMENLJIVK, KLASIFIKACIJ, DOVOLJENIH VREDNOSTI, STAT. KARAKTERISTIK ... UPORABNIKI (SLOVENIJA, EU ...) • UPORABNIKI: • Aplikaciji Klasje, Metis • MS Excel,Word C I L J N A S H E M A G L A V N E G A T O K A P O D A T K O V N A S U R S V okviru skupine P/STAT2000 osnovno shemo izdelala ga. Julija KUTIN
Zbiranje in urejanje podatkov - uporabljena orodja: • Blaise + VB: • Vnos z urejanjem podatkov:- s klasičnih obrazcev na papirju - anketiranje (kontakt z respondenton): CAPI, CATI • Hitri vnos podatkov (urejanje naknadno, paketno ali interaktivno) • Urejanje podatkov • Edisent: elektronsko poročanje • SAS:(v procesu zbiranja pod.) - priprava vzorcev • Godar, Cobol, PL-1: urejanje podatkov
GEntry (generator aplikacij za hitri zajem podatkov): ekran za specifikacijo podatkovnega modela
Primer ekrana za vnos podatkov za anketno raziskovanje (CAPI, CATI)
Primer uporabniškega vmesnika za anketno raziskovanje s kombiniranim zbiranjem podatkov
Smernice: • Enostavnost, robustnost in fleksibilnost arhitekture (Sundgren, 2000: smernice za relacijo med statističnim IS in njegovimi elementi) • Prisotnost metapodatkov v celotnem procesu • Razvoj in vključevanje novih rešitev (kombinirano zbiranje pod., elektronsko poročanje, Internet itd). Cilj: izboljšati kvaliteto dela in rezultatov • Upoštevanje in usklajevanje potreb vseh udeležencev v statističnem procesu