280 likes | 389 Views
Integrált (nem csak) államigazgatási adatbázisok a pályakövetésben. Fodor Szabolcs EDUCATIO Nonprofit Kft. „Adatalapú döntéshozatal és stratégiaalkotás a felsőoktatásban” 2011 . február 24. DPR Adattár tartalma, főbb elemei Államigazgatási adatok bevonásának indokoltsága
E N D
Integrált (nem csak) államigazgatási adatbázisok a pályakövetésben Fodor Szabolcs EDUCATIO Nonprofit Kft. „Adatalapú döntéshozatal és stratégiaalkotás a felsőoktatásban” 2011. február 24.
DPR Adattár tartalma, főbb elemei • Államigazgatási adatok bevonásának indokoltsága • Tervezett – megvalósult menetrend • Adatforrások bemutatása, kapcsolódásuk • Adatintegráció lépései, a „módszertan” • Az eredmény, felhasználási célok • Tanulságok, tapasztalatok • Tervek, továbblépés Előadás tervezett tartalma
Az „érzékenyített” szektor, kihegyezett fülek… • Az érzésekre, sajtóhírekre alapozott következtetések veszélyei • Rendelkezésre állnak az adatok, csak „le kell értük hajolni” • A felsőoktatás kimeneti mutatóinak figyelmen kívül hagyása rövidtávon káros, hosszútávon bűn! • Tévhitek és rémhírek terjesztése helyett: kerüljenek helyükre a tények! Miért fontos az „adatalapú” megközelítés?
DPR Adattár főbb elemei „Az ismétlés a tudás anyja… és az unalom apja.”
Több, egymástól független adatforrást von be • Jól illeszkedő adatkörök alakíthatók ki (szövetszerűség) • Különböző vizsgálati keretben értelmezhető (és értelmezendő!) adatok • Adatvédelmi szempontok: önbevallás, hozzájárulás és személyes adatok szükségtelensége Megoldás az adattár? Mire?
Két nagyon fontos saját kutatás hallgatók és (2007-ben) végzettek körében (ΣN=~13.000 fő) • Reprezentativitás, mintakialakítás miatt kontrollt jelenthetnek • Bizonyos csoportokra vonatkozóan elsőként kaptunk visszajelzéseket (BA/BSc) • Előkészítették az intézményi kutatásokat, segítségül szolgáltak a módszertani alapok kialakításában „Saját” kutatások helye és szerepe
2007-ben és 2009-ben végzettek elhelyezkedése, hallgatók munkaerő-piaci motivációi • 29 intézmény szolgáltatott adatot kb. 50 000 fő végzett és hallgató, egy helyen elérhető: www.diplomantul.hu • Az első országos adatok a BSc diploma munkaerő-piaci fogadtatásáról! • Probléma: az alacsony válaszadás, 10-20% (2009: induló év), adatszolgáltatás módjának kiforratlansága (VIR-ek, rendszerek fejlődése megoldást hoz) Intézményi kutatások - adatintegráció
Jelentős mennyiségű adat áll rendelkezésre az államigazgatási adatbázisokban • Az adatok keletkezési körülményeinek köszönhetően szinte teljeskörű adatforrások (kötelező adatszolgáltatások stb.) • Kevésbé szubjektívek, még ha bizonyos korlátokkal ezek esetében is számolni kell • Az érintett potenciális adatforrások egyre jobbak, egyre inkább „használhatóak” Miért kellenek államigazgatási adatok (is)?
Közvetlen szerződéses kapcsolat a potenciális adatszolgáltatókkal • Egyeztetjük az adatköröket, a szükséges adatokat nyers formában adják át • Adatok 5 személyes adat segítségével kapcsoljuk össze (név, szül. dátum stb.): átadjuk ezeket, és visszakapjuk a jövedelmi, munkaerő-piaci adatokat (személyes adatok nélkül) Először tervezett módszertan és menetrend
Adatvédelmi akadályok: személyes adatok változatlan formában nem adhatók át másik, akár hatósági szervnek sem, ha nincs erre törvényi felhatalmazás (vagy beleegyezés) • Törvénymódosításra kevés esély volt • Nehéz volt mindegyik potenciális adatforrással külön-külön tárgyalni az adatok átadásáról • Kellett egy „törvény hátszele” a megvalósításhoz, ez nem volt meg (Ftv. Vonatkozó része nem elég ehhez) … és hogy miért nem működött?
Az államnak és az államigazgatási szerveknek kötelessége, hogy a gazdaságra és a társadalmi folyamatokra kiható döntéseiket előzetesen mérlegeljék, eredményüket utólagosan vizsgálják. • Államigazgatási adatbázisokból származó adatok anonim összekapcsolása, a megfelelő statisztikai adatbázis előkészítése: Neumann Nonprofit Kft. • FONTOS! Személyes (jogtalan) adatkezelést nem valósítunk meg, mindenki csak azokat az adatokat kezeli, amire felhatalmazása van! 2007. évi CI. Törvény lehetőségei
N A V (APEH) Adatok összekapcsolása HASH-AZONOSÍTÓK alapján ALGORITM.+MINTA Adatintegrációs folyamat bemutatása ADATOK Neumann Kft. (lebonyolítás, adatössze-kapcsolás) F I R (minta+tanulm adatok) ALGORITMUS O E P ALGORITM.+MINTA MINTA + TAN. ADATOK ADATOK INTEGRÁLT ADATOK ADATOK F H (FSZH) • Törvény írja le a módszertant • Nincs személyesadat-mozgás! • Nem visszaazonosíthatóak az alanyok! ALGORITM.+MINTA
Az „induló adatok” forrása csak a FIR lehetett • Állami regiszterek legyenek, közhiteles és megbízható adatokkal • Munkaerő-piaci adatok kellettek a következőkről: • Jövedelem, igénybe vett (állami) támogatások, • Elhelyezkedési dinamika, paraméterek, • Munkaadókkal kapcsolatos információk, • Munkanélküliség, passzivitással kapcsolatos információk, • Regionalitás, (legalább belföldi!) diplomás migráció • Technikailag alkalmas legyen az integrációra Adatforrások kiválasztásának szempontjai
CÉL: tanulmányi előélet, továbbtanulási tendenciák vizsgálata • Végzett hallgatók demográfiai adatai, amit az anonimitás megenged (pl. nem, régió, állampolgárság) • Végzettségi adatok (pl. képzés, típus, félévszám, finanszírozás) • Korábbi végzettség (ld. előző) • Jelenlegi tanulmányi adatok (aktuális képzési információk) A FIR érintett adatkörei
Neme • SzulOrszagRegio • SzulEvKat • LakcimMegye • LakcimTeltip • TarthelyMegye • TarthelyTeltip • MagyAllampolg • KulfAllampolg • VegzID1 • VegzID1_kter • VegzID1_tip • VegzID • VegzID2_kter • VegzID2_tip • VegzIntID • VegzKepzIdo • VegzKezd • VegzVeg • VegzFelev06E • VegzFinFelev06E • VegzOsszFelev06U • VegzFinFelev06U • KepzLezarDatum • KepzLezarIndok • KulfTanHonap • VonatkOrszKat • RegiVegzID • RegiVegzID_kter • RegiVegzID_tip • RegiVegzIntID • RegiVegzKepzIdo • RegiVegzKezd • RegiVegzVeg • RegiVegzVegOk • RegiVegzOsszFelev • RegiVegzFinFelev • RegiVegzLezarDat. • REGIVEGZLEZARIN. • UjKepzID • UjKepzID_kter • UjKepzID_tip • UjKepzIntID • UjKepzKepzIdo • UjKepzKezd • UjKepzOsszFelev • UjKepzAllFin A FIR érintett adatkörei - „nyers” változók
Munkavállalói (kifizetett bérekre és juttatásokra kiterjedő) havi adatszolgáltatás • Ún. „08-as” nyomtatványcsomag adatai • Van a Munkáltatóra és a Munkavállalóra vonatkozó része • Több munkáltató/munkakör = több jogviszony • Nincs teljes évi adat, két hónap „pillanatfelvétele”: • Végzés hónapja • 2010 márciusa A NAV (APEH) érintett adatkörei
AlkMinJog • OsszevJov • BerJov • HallgJutt • OdijFogl • UtrOdij • StartKarFoglTelj • StartKarFoglReszm • StartPluszKarFoglTelj • StartPluszKarFoglReszm • StartExtraKarFoglTelj • StartExtraKarFoglReszm • KozmunkTelj • KozmunkReszm • AllaskerFoglTelj • AllaskerFoglReszm • KifFoTeaor • KifGazdAgaz • KifGazdForma A NAV (APEH) érintett adatkörei -„nyers” változók
Munkavállalói adatszolgáltatás alkalmazás tényéről, módjáról, egyéb körülményeiről • Ún. „1041-es” nyomtatvány adatai • Van a Munkáltatóra és a Munkavállalóra vonatkozó része (szintén) • Több munkáltató/munkakör = több jogviszony (szintén) • Minden, alkalmazási körülményben beállt változás esetén újabb adatszolgáltatás • Mindegyik elérhető adatszolgáltatás adatai fontosak Az OEP érintett adatkörei
Valamely munkaerő-piaci eszközt igénybevevőkről nyilvántartást vezetnek • Nem csak a (regisztrált!) munkanélküliek vizsgálata a cél, fontosak a képzések, egyéb eszközök • Csak egyénekre vonatkozó információk • Adatok a 2009.01.01-től 2010.12.31-ig terjedő időszakra vonatkozóan • Egyénenként akár több jogcím • Hangsúlyosan vizsgálnánk a diplomaszerzést követően képzésben résztvevőket Az FH érintett adatkörei
OEP változók • LakoIrsz • BSZJJogvKezd • BszjJogvVeg • BszjJogvKod • MunkFeor • MunkaOra • MunkMegye • MunkIrSz • MunkAlkSzam • FH változók • RegisztrDatum • Mpiac_reszv • ReszKod • MpiacKepzFotip • MpiacKepzAltip • BefKepzMod • TanfDij • TamTanfDij • Egykolts Az OEP és az FH érintett adatkörei -„nyers” változók
FIR (induló): ~54.100 fő • NAV (APEH): • ~34.700 rekord • ~22.400 fő • OEP: • ~43.200 rekord • ~25.000 fő • FH: • ~2.200 rekord • ~1.500 fő A (NYERS!) adatok mennyiségéről…
A V I R • Ágazati szintű tanulmány(ok), stratégiai javaslatok • Oktatáskutatási tanulmányok, elemzések • A széles(ebb) közvélemény számára készített rövid elemzések • Tájékoztatók, pályaorientációs célok Adatok tervezett felhasználási célja
Az első fecskék között lenni nehéz • A FIR, mint forrásadatbázis több adatkör esetében további fejlesztésre, adattisztításra szorul • Az államigazgatási szereplők (forrásadatbázisok) többsége nincs még felkészülve erre a módszertanra • Nincsenek, illetve hiányosak a potenciális adatforrásokat leíró metaadatbázisok • Változó a forrásadatbázisok adatminősége is, további tisztításra van szükség • Közös pont kellene: KEKKH-val való szinkronizáció? Tapasztalatok, tanulságok
Adatok mélyebb megismerése, lehetőségek és korlátok mélyebb vizsgálata • Adatok AVIR-ba történő „bedolgozása”, riportok stb. kialakítása • Törvényi keretek erősítése – jogszabályalkotás • Következő adatintegráció forrásának biztosítása, szakmai előkészítése • További adatforrások felkutatása, az integráció előkészítése • További szakértők bevonása, a szakértői kör bővítése További tervek, feladatok, céljaink
„Van, aki a lehetőségben a problémákat látja, és van, aki egy problémában a lehetőségeket!” /Ismeretlen forrás/ MOTTÓ, köszönet
Köszönöm a figyelmet! Fodor Szabolcs fodor.szabolcs@educatio.hu