200 likes | 365 Views
Sistem online de verificare a autenticit ăţii documentelor. Proiect realizat de Radu -Constantin Ciob ănică Coordonat de S.L. Dr. Ing. Iulian Niţă. Structura lucrării. Forme de plagiat Scenarii vizate Metode de evitare Algoritmul Smith -Waterman Algoritmul Boyer-Moore
E N D
Sistem online de verificare a autenticităţii documentelor Proiect realizat de Radu-Constantin Ciobănică Coordonat de S.L. Dr. Ing. Iulian Niţă
Structura lucrării • Forme de plagiat • Scenarii vizate • Metode de evitare • Algoritmul Smith-Waterman • Algoritmul Boyer-Moore • Criterii de performanţă • Comparaţie între algoritmi • Concluzii • Implementare
Forme de plagiat • Copy & paste • Schimbarea cuvintelor • Plagiatul de stil • Plagiatul metaforei • Plagiatul de idei
Scenarii vizate • Boyer-Moore: • copy&paste • schimbare ordine de apariţie • Smith-Waterman: • cuvinte derivate • plagiat de stil • plagiat metafore
Tehnici de evitare • Înţelegerea plagiatului • Folosirea surselor multiple • Semnele citării – ghilimelele • Referinţe la parafraze • Referinţe la reformulare sau rezumare • Precizarea surselor
Smith-Waterman • Compară segmente de toate lungimile • Găseşte similarităţi structurale 1. Preprocesare: • Iniţializare matrici • Maparea caracterelor
Smith-Waterman 2. Calcularea matricii de scoruri
Smith-Waterman 3. Calcularea părinţilor (traceback)
Smith-Waterman 4. Identificare potriviri semnificative • Decizie dependentă de valoarea scorului 5. Populare matrice M.
Boyer-Moore • Analiza se face de la dreapta la stânga • Căutare la nivel de pattern • Dispune de shift-ări inteligente
Boyer-Moore • Preprocesare: • Indexare • Generare tabele shift-are în funcţie de ocurenţă
Boyer-Moore 2. Aliniere pattern 3. Compararea cu ultimul caracter: • Shift-are caracter greşit(distinct)
Boyer-Moore • Shift-are cu sufix bun - shift-are 2 poziţii
Boyer-Moore • Shift-are cu sufix bun - shift-are 5 poziţii
Criterii de performanţă Smith-Waterman: • Complexitate temporală: O(M+N) + O(MN) + O(MN) = O(MN) Iniţializare umplere matr traceback Boyer-Moore: • faza de preprocesare O(M+ N) de timp şi spaţiu; • faza de căutare în O(MN); • performanţă maximă O(N/M)
Comparaţie algoritmi • Dimensiune eşantion / şir: • Eficienţa în timp • Spaţiu de stocare necesar • Ţinta analizei
Concluzii • “Ligi” diferite • Funcţionalităţi complementare • Performanţe complementare