260 likes | 416 Views
Centrálny register záverečných prác v SR a kontrola originality dokumentov ako centrálne poskytovaná služba. Juraj Noge CVTI SR, Bratislava juraj.noge @ cvtisr.sk. CASLIN 2011, 12. – 15 .6. 2011. OBSAH. Zopár slov o plagiátorstve na úvod Etapy riešenia CRZP a APS
E N D
Centrálny register záverečných prác v SR a kontrola originality dokumentov ako centrálne poskytovaná služba JurajNoge CVTI SR, Bratislava juraj.noge@cvtisr.sk CASLIN 2011, 12. – 15.6. 2011
OBSAH • Zopár slov o plagiátorstve na úvod • Etapy riešenia CRZP a APS • Proces zberu a overovania prác • Stručný popis technického riešenia • Čísla a štatistiky • Ohlasy, prínosy a hodnotenie po prvom roku • Perspektíva ďalšieho rozvoja • Záver
ÚVOD • Plagiátorstvo ako celospoločenský fenomén • Problém neoprávneného preberania resp. napodobovania výsledkov cudzej duševnej činnosti • V súčasnosti ho uľahčuje najmä: • Dostupnosť informačno-komunikačných technológií prakticky pre každého • Dramatický rast obsahu, ktorý je dostupný cez Internet
ÚVOD • Plagiátorstvo prináša nezaslúžený profesný, spoločenský, ale nezriedka i finančný benefit • Najvypuklejšie v oblasti školstva • Môže kaziť dobré meno inštitúcie, v ktorej sa práca obhájila • Riešenia v SK: • Na lokálnej úrovni • Komplexné riešenie na celoslovenskej úrovni včítane centrálneho úložiska všetkých prác
ETAPY RIEŠENIA • Úvodná analyticko – koncepčne - organizačná etapa – r. 2009: • Riešila centrálne úložisko všetkých záverečných a kvalifikačných prác • MŠ SR – iniciátor a zastrešovateľ • Realizovaná pod gesciou UKF v Nitre • SVOP, s.r.o – vybraná ako externý dodávateľ
1. ETAPA • Činnosti počas 1. etapy riešenia: • Identifikácia východiskového stavu • Navrhla sa koncepcia, ktorá riešila: • Legislatívu • Problematiku autorských práv a licenčných zmlúv na diela • Finančné a organizačné zabezpečenia projektu v celej jeho šírke pôsobenia • identifikáciu logistiky a dopadov na akademické informačné systémy a pod.
1. ETAPA • Konkrétne napr: • vydanie Metodického usmernenia MŠ SR č, 14/2009 • Novela VŠ zákona s účinnosťou od 1.1.2010 a pod. • Pripravila sa koncepcia technického riešenia samotného
2. ETAPA • 2. etapa riešenia – implementácia CRZP: • Implementácia CRZP: • Technický návrh riešenia • Vývoj programového vybavenia • Vybudovanie technickej infraštruktúry • Inštalovanie potrebného SW vybavenia u prevádzkovateľa ako i na VŠ • Testovacie práce
2. ETAPA • Dobudovanie požadovanej infraštruktúry na strane vysokých škôl v súvislosti s exportom prác do centrálneho registra • Testovanie funkcionality prenosových rozhraní medzi centrálnym registrom a AIS • Príprava pokynov, vysvetlení a pod., súvisiacich s prijatou právnou normou • Zmena prevádzkovateľa - ministerstvom priamo riadená organizácia - CVTI SR so sídlom v Bratislave
3. ETAPA • 3. etapa riešenia – implementácia APS: • Antiplagiátorský systém – nadstavba CRZP • Obstarávateľ CVTI SR • VO – tvrdé podmienky - 1. pokus neúspešný • Koniec r. 2009 - priame rokovacie konanie • Zmluva s fi. SVOP, s. r. o. • Koncom apríla 2010 systém uvedený do ostrej prevádzky
PROCES ZBERU A OVEROVANIA PRÁC • 75% VŠ už práce zbieralo vo svojich EZP • Bakalárske, diplomové, dizertačné; rigorózne, habilitačné • Nutnosť dovybavenia rozhraním, kompatibilným s rozhraním CRZP • Proces zberu na VŠ – požadovaný formát, metadáta, licenčné zmluvy • Prenos do CRZP - z EZP v dávkach • Najprv metadáta, potom sa stiahnu samotné práce
PROCES ZBERU A OVEROVANIA PRÁC • Kontrola prijatej dávky záverečných prác na plagiátorstvo voči porovnávaciemu korpusu • Výsledky porovnania na plagiátorstvo systém automaticky posiela späť príslušným vysokým školám • Samotné texty prác sa začlenia do porovnávacieho korpusu APS • Výsledky porovnania sú len podkladompre posúdenie a hodnotenie práce príslušnou komisiou
POPIS TECHNICKÉHO RIEŠENIA • Technicky sú systémy CRZP a APS konštruované ako systém spolupracujúcich serverov • Samotný antiplagiátorský systém je súborom viacerých aplikácií a originálnych algoritmov, ktoré vytvorili vo firme SVOP, s.r.o. • Sú navrhnuté ako agentový systém a sú spúšťané dynamicky na základe podnetov
ČÍSLA A ŠTATISTIKY • Do systému CRZP/APS posiela v súčasnosti záverečné a kvalifikačné práce na porovnanie na plagiátorstvo 33 vysokých škôl • Za prvý akademický rok prevádzkovania sa v systéme CRZP/APS zhromaždilo cca 71 000 záverečných a kvalifikačných prác. • Zaberajú cca 160 GB úložného priestoru • Predpoklad podobný aj na ďalšie roky • Momentálne už cca 140 000 prác
ČÍSLA A ŠTATISTIKY • z Internetu stiahnutých asi 3.4 milióna dokumentov v objeme cca 1.4 TB dát • Porovnanie jednotlivého dokumentu oproti dnešnému korpusu vrátane spracovania metadát a vygenerovania PDF protokolu trvá v priemere 10 sekúnd. • Maximálna dennú dávka dokumentov mala 4900 súborov, čo trvalo cca 10 hodín
OHLASY, PRÍNOSY A HODNOTENIE • Počiatočný mediálny záujem rýchlo ustal • Zo strany vysokých škôl prichádzali väčšinou pozitívne reakcie • Samotné technické riešenie sa ukázalo ako veľmi stabilné a vcelku bezproblémové • Zatiaľ sa javí, že porovnávacie algoritmy sú dostatočne rýchle a systém stíha produkovať výsledky s časovou rezervou, čo je veľmi pozitívne
OHLASY, PRÍNOSY A HODNOTENIE • Kvalitu APS algoritmov plánuje dodávateľ preveriť v medzinárodnej konkurencii na workshope v Amsterdame na jeseň 2011 • Systém má určite preventívny účinok (skôr psychologického charakteru • Krátke obdobie na objektívne hodnotenie prínosov • Riešenie je inšpiratívne a príťažlivé aj pre susedov (Poľsko)
PERSPEKTÍVA ĎALŠIEHO ROZVOJA • Prenos prevádzky systému do novovybudovaného DC VaV, ktorého je CVTI SR prevádzkovateľom a ktoré poskytuje IKT infraštruktúru najvyššej kvality. • Urýchli sa proces porovnávania • Poskytne vyššiu kvalitu zabezpečenia dát • Sprístupnenie záverečných prác, uložených v CRZP verejnosti v zmysle novely VŠ zákona • Zabudovanie primárnych zdrojov (zákony, smernice, normy, ...)
PERSPEKTÍVA ĎALŠIEHO ROZVOJA • Skvalitnenie porovnávacieho korpusu • Staršie práce z VŠ • Monografie, skriptá, učebnice (?problém AZ) • Vytypovať ďalšie internetové zdroje • Skvalitnenie porovnávania zamontovaním morfologického a synonymického slovníka resp. slovníka koreňov slov • Vylepšenie funkcionality, používateľského komfortu a možností nastavenia systému pre administrátorov a prevádzkovateľov systému
PERSPEKTÍVA ĎALŠIEHO ROZVOJA • Optimalizácia výstupných protokolov • Implementácia opatrení proti trikom, ktorými sa niektorí autori prác snažia „oklamať“ antiplagiátorský systém • Dať systém k dispozícii aj na overovanie iných dokumentov ( seminárky, vedecké, projektové, ...) • Prepojenie s inými informačnými systémami
ZÁVER • Systém CRZP/APS má charakteristiku centrálne poskytovanej služby, hoci je poskytovaná len vybranej skupine klientov • O to viac, že je poskytovaná bezplatne • Systém CRZP/APS sa perspektívne plánuje rozšíriť aj o poskytnutie služieb iným inštitúciám ako sú len vysoké školy. Uvažuje sa napr. o overovaní dokumentov, ktoré sú výstupmi výskumu a vývoja alebo dokumentov, ktoré sú súčasťou projektov finančne podporených z verejných zdrojov.
ĎAKUJEM ZA VAŠU POZORNOSŤ OTÁZKY? JurajNoge CVTI SR, Bratislava juraj.noge@cvtisr.sk