160 likes | 347 Views
PALIROM – Produse rezultante. * SOFTWIN. Aplicaţii lingvistice. Spell -Checker Analizor gramatical ( Grammar checker ) Lematizor / Flexionator Adnotare morfologică şi semantică Automatizarea desp ărţirii în silabe Indexare/Căutare Traducere semi-automat ă şi automa tă
E N D
PALIROM – Produse rezultante *SOFTWIN
Aplicaţii lingvistice • Spell-Checker • Analizor gramatical (Grammar checker) • Lematizor/Flexionator • Adnotare morfologică şi semantică • Automatizarea despărţirii în silabe • Indexare/Căutare • Traducere semi-automatăşi automată • Dicţionare electronice
1.Spell-Checker Configurator Morfologic Forme flexionate Alfabet Lexicon (leme) Spell-checker Cuvinte eronate Lipsă diacritice Caracterizări morfologice
1.Spell-Checker Spell-Checker integrat pentru suita de aplicaţii Microsoft Office Număr foarte mare de cuvinte recunoscute (~840.000 forme flexionate mono-cuvânt pentru limba română) Detectarea automată a diacriticelor lipsă Poate afişa caracterizările morfologice ale cuvintelor, precum şi forma lemei Dicţionar compact, viteză mare de execuţie Informaţiile şi algoritmii sunt independenţi de platformă (se pot crea module spell-checker pentru aplicaţii Linux, pentru pachetul OpenOffice.org, pentru browsere web, etc.)
2. Analizor gramatical Configurator morfologic Forme flexionate Alfabet Lexicon (leme) Sintaxă Textul de analizat Analizor gramatical Arbore de dependenţe
2. Analizor gramatical Datele de intrare ale analizorului: Alfabetul limbii Formele flexionate (cu caracterizări morfologice şi referiri către lemele din care provin) Lista lemelor (cu caracterizări morfologice) Gramatica limbii (sintaxa descrisă în limbaj GRAALAN, prelucrată şi optimizată) Textul de analizat (analiza textului se face la nivel de frază)
2. Analizor gramatical Paşii necesari analizei gramaticale: Adnotarea textului de intrare: împărţirea în token-uri, căutarea formelor flexionate mono-cuvânt, ataşarea interpretărilor morfologice posibile fiecărui token Analiza gramaticală: parcurgerea gramaticii, expandarea neterminalilor, construirea arborelui de dependenţe pentru textul de intrare Semnalarea erorilor gramaticale, cu sugestii de corectare
2. Analizor gramatical Funcţii: analiza sintactică şi morfologică a textului semnalarea erorilor gramaticale dezacorduri lipsa semnelor de punctuaţie lipsa predicatelor inserarea/inversarea cuvintelor în formele multi-cuvânt variante de corectare a erorilor, eventual de reformulare a textului Nu există până acum un analizor gramatical (grammar-checker) bun pentru limba română
2. Analizor gramatical Datele de ieşire ale analizorului: Arborele de dependenţe al textului analizat Mesaje de eroare Sugestii de corectare
3. Lematizor / Flexionator Lematizor: găsirea formei de dicţionar (lemă) pentru o formă flexionată. Flexionator: generarea formelor flexionate ale unei leme, pentru toate situaţiile morfologice în care se poate afla.
4. Adnotare morfologică şi semantică Adnotator mono-cuvânt (afişarea tuturor interpretărilor unui cuvânt) Adnotator multi-cuvânt (identificarea formelor multi-cuvânt într-un text) Adnotator de sensuri mono-cuvânt (se indică toate sensurile unui cuvânt)
5. Automatizare despărţire în silabe Forme flexionate (text, fonetic) Alfabet Reguli de despărţire în silabe Despărţire în silabe
6. Indexare - Căutare Sistem de indexare / regăsire (stand alone sau WEB) pesteun set dat de documente Modul de lematizare/ flexionare Alfabet Motor de indexare / căutare Forme flexionate Lexicon (leme)
9. Traducere Text limbă sursă Text limbăţintă Bază de cunoştinţe limbă sursă Bază de cunoştinţe limbă ţintă Analizor gramatical Generator text Corespondenţe bilingve Metodă traducere arbore de dependenţe Arbore de dependenţe limbă sursă Arbore de dependenţe limbă ţintă
2.Dicţionare electronice Dicţionar lexical(explicativ) Dicţionare de sinonime/ antonime/ paronime/ omonime Dicţionar de expresii Dicţionare semantice