230 likes | 337 Views
XML-alapú komplex korpusz-lekérdezés. Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu. Mi a Xaira ?. XML szövegek indexálása és lekérdezése Indexálás (xaira-tools.exe) Nagy mennyiségű szöveg feldolgozása Gazdag XML annotáció kezelése
E N D
XML-alapú komplexkorpusz-lekérdezés Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu
Mi aXaira? • XML szövegek indexálása és lekérdezése • Indexálás (xaira-tools.exe) • Nagy mennyiségű szöveg feldolgozása • Gazdag XML annotáció kezelése • Lekérdezés (xaira.exe/hxaira.exe) • Kliens és részletes súgó magyarul • Bonyolult lekérdezések
Az indexálás minimális feltételei • Jól formált XML • <text> </text> tagbe ágyazott szöveg • A szöveg kódolása UTF-8 vagy az XML fejlécben megadott kódolás • <?xml version="1.0" encoding="iso-8859-2" ?>
Egy szöveg <text> Abigél. Gina intézetbe kerül. A változás, ami életében bekövetkezett, annyi mindentől megfosztotta, mintha bomba pusztított volna az otthonában. Elsőnek Marszell <IGEKOTOS>tűnt el</IGEKOTOS>, akit kisasszonynak szólított, mióta csak ismerte, de akire azért sosem úgy gondolt, mint egy francia lányra, aki tizenkét esztendőn át a mellette levő szobában lakott, és őt nevelte. Marszell mindig megértette még azt is, amit Gina nem is <IGEKOTOS>fogalmazott meg</IGEKOTOS>.
www.xaira.org Köszönömafigyelmet!