130 likes | 338 Views
OBDELAVA (PROCESIRANJE PODATKOV). Pojem in vloga editiranja v obdelavi podatkov Osnovni pristopi in tehnike Avtomatsko editiranje Selektivno editiranje Makro editiranje Raziskovalni projekti Literatura. OBDELAVA (PROCESIRANJE PODATKOV ). Vnos podatkov Editiranje Imputiranje
E N D
OBDELAVA (PROCESIRANJE PODATKOV) Pojem in vloga editiranja v obdelavi podatkov Osnovni pristopi in tehnike Avtomatsko editiranje Selektivno editiranje Makro editiranje Raziskovalni projekti Literatura
OBDELAVA (PROCESIRANJE PODATKOV) • Vnos podatkov • Editiranje • Imputiranje • Ocenjevanje, agregiranje • Integriranje • Analiza (časovne serije in sezonske prilagoditve, izračun indikatorjev, indeksov)
KAJ JE EDITIRANJE (UREJANJE) PODATKOV • Editing procedure… process of detecting and handling errors in data. Glossary of Terms on Statistical Editing, UN, 2000 • Editing is the examination of data for the purpose of error detection. (ABS; 1993)
KAJ PRINAŠA EDITIRANJE • Informacije o kvaliteti podatkov • Odpravo napak • Izhodišča za izboljšanje raziskovanj v prihodnosti • Nevarnost pre-editiranja
VIDIKI EDITIRANJA • Kontrola polnoštevilnosti (kompletnosti) • Rutinska kontrola • Kontrola (veljavnosti) validnosti podatkov • Relacijska kontrola • Aritmetična kontrola • Stohastične in deterministične kontrole
IZVEDBA EDITIRANJA • Papir in svinčnik • Iterativni postopek vnosa podatkov in odprave napak • Računalniško podprt vnos in editiranje (head-up) • Avtomatsko editiranje • Selektivno editiranje
AVTOMATSKO EDITIRANJE • Fellegi in Holt (1976) - identifikacija ‘okuženih’ področij; • Uporaba v praksi (Kanada, Italija, Španija) • Koraki pri avtomatskem editiranju: • Identifikacija napak in nekonsistentnosti • Nekonsistentnost: opredelitev področja z napako • Popravki in imputiranje • Primer • Pogoji uporabe Fellegi - Holt metodologije
AVTOMATSKO EDITIRANJE Hot- deck pristop: kontinuirano korigiranje podatkov s pomočjo ažurirane tekoče baze Cold- deck pristop: korigiranje podatkov s pomočjo dane (fiksne) baze
SELEKTIVNO EDITIRANJE Odkrivanje individualnih napak- osamelcev (outlier) po vnaprej znanih kriterijih ; • Hidiroglou in Berthelot (1986) – ‘Score Function’- indikator proritet za mikro editiranje • Van de Pol and Molenaar (1996) - indeks rizičnosti, ki primerja velikost napake in pomen enote
MAKRO EDITIRANJE(OUTPUT KONTROLA) (Granquist, 1990; Granquist in Kovar , 1997) • Agregatna metoda (primerjava agregatnih vrednosti različnih obdobij) • Metoda porazdelitve (primerjava individualnih vrednosti glede na porazdelitev) Uporabnost pri ekonomskih spremenljivkah, tako kot pri mikroeditiranju težave pri sistematičnih napakah
RAZISKOVALNI PROJEKTI • AUTIMP(Automatic Imputation software for business surves and population censuses) v okviru DOSIS • EUREDIT (Development and Evaluation of New Methods for Editing and Imputation) v okviru EPROS • CHINTEX The Change from Input Harmonisation to Ex-post Harmonisation in NationalSamples of the European Community Household Panel – • DACSEIS Data Quality of Complex Surveys within the New Euroepan Information Society
Literatura Willeboordse Ad (ed.): Handbook on the Design and Implementation of Business Surveys, Eurostat, 7/C, 1998 UN Statistical Commission and Economic Commision for Europe: • Statistical data Editing . Methods and Techniques. Volume 1. Statistical Standards and Studies. No.44, 1994, str.239. • Statistical data Editing . Methods and Techniques. Volume 2. Statistical Standards and Studies. No.48, 1997, str.239.
LITERATURA UN Statistical Commission and Economic Commision for Europe: • Glossary of terms on statistical data editing • Evaluating efficiency of statistical data editing: general framework • Work session on statistical data editing