1 / 26

Lexikográfia, ontológiák

Lexikográfia, ontológiák. A számítógépes nyelvfeldolgozás alapjai. A számítógépes nyelvfeldolgozás alapjai – 2013. március 28. Bevezetés. Lexikográfia: szókincs (szavak és kifejezések) kutatása, gyakorlati szempontú leírása Szótár: szavak (és jellemzőinek) gyűjteménye

velma
Download Presentation

Lexikográfia, ontológiák

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Lexikográfia, ontológiák A számítógépes nyelvfeldolgozás alapjai A számítógépes nyelvfeldolgozás alapjai – 2013. március 28.

  2. Bevezetés Lexikográfia: szókincs (szavak és kifejezések) kutatása, gyakorlati szempontú leírása Szótár: szavak (és jellemzőinek) gyűjteménye Ontológia: Lételmélet? Tudás megosztása? Számítógépes szótár? Fogalmi háló?

  3. Elektronikus szótárak Hagyományos (papír)szótár Elektronikus szótár Könnyebb és gyorsabb a keresés (szófaji információ is) Toldalékolt alakok is megtalálhatók Nincsenek terjedelmi korlátok

  4. Többszavas kifejezések Hol találhatók meg? Alaptagnál, de nem egységes a lexikográfiai gyakorlat Melyik az alaptag? (kutya vagy szalonna) Elektronikus szótárnál nem releváns kérdés

  5. Ontológiák Fogalmi hálók Viszonyok alapján rendezett fogalmak (alá- és fölérendeltség, hierarchiák…) Taxonómiák (pl. biológiai rendszertan) Nyelvi ontológiák: nyelvi információt is tartalmaznak a hálón kívül

  6. WordNet Lexikális adatbázis Fogalmak hálóba rendezve különféle relációk alapján Angol: Princeton WordNet Más nyelvekre is: EuroWordNet stb. Synset: szinonimahalmaz

  7. Princeton Wordnet Eredetileg az emberi agy nyelvi tudásreprezentációjának modellje Ennek szánták (inkább elméleti nyelvészeti / filozófiai indíttatás) Más, mint egy szótár – szavak szintjén redundancia A legnagyobb, egységes lexikai adatbázis Ingyenes Gépileg feldolgozható információ Számítógépes nyelvészet egyik alapvető eszköze lett

  8. PWN mérete (3.0)

  9. Szemléltető ábra

  10. EuroWordNet Sok nyelvre létezik EuWN, BalkaNet, később csatlakozó (magyar), … Ezek méretre nagyon változók (magyar 40k synsettel a nagyobbak között) XML adatformátum Közös alapfogalmak 8516 fogalom Közös javaslatok alapján PWN-ben sok relációban szereplő csomópontok

  11. HuWN Partnerek: Szegedi Tudományegyetem Informatikai Tanszékcsoport MTA Nyelvtudományi Intézet MorphoLogic Kft. Budapest Időtartam: 2005. február 1. - 2007. április 30. http://www.inf.u-szeged.hu/rgai/HuWN

  12. A HuWN bemutatása 40000 synset (általános ontológia) + 2000 üzleti nyelvi synset (szakontológia) + 650 jogi nyelvi synset (szakontológia) Főnevek Igék Melléknevek Határozószók Ahol csak lehet, a PWN-nek megfeleltetni a synseteket Szerkesztéshez használt program: VisDic

  13. Szófaji eloszlás

  14. Synsetek Megközelítőleg azonos jelentésű szavak (literálok) alkotnak egy synsetet Synseten belül a fő szervező reláció a szinonímia Jelentésmegkülönböztetés miatt sorszámozott literálok Példa: {zsineg1, zsinór1, madzag1, spárga1}

  15. Synsetek - 2 Szófaj Szinonimák (literálok) Definíció Tipikus használat – példamondat ÉKSz.-beli megfelelő Domén Relációk más synsetekkel

  16. Relációk a HuWN-ben: főnevek Alapvető rendező reláció a hipernima-hiponima Alá- és fölérendeltségi viszonyokat mutató fák Példa: bicikli Különböző szintű hiponimák: kutyaféle – emlős – állat – entitás

  17. Relációk a HuWN-ben:főnevek - 2 Antonímia (near_antonym): ellentét Példa: férj – feleség Holonímia – meronímia: rész-egész viszonyok Példa: kalap – karima (rész) újság – papír (anyag) csatár – focicsapat (tag)

  18. Melléknevek a HuWN-ben Alapvető szemantikai kapcsolat: antonímia Hideg – meleg, szép – csúnya stb. Központi literálok köré vannak összegyűjtve a hasonló jelentésű, specifikusabb melléknevek

  19. Melléknévi relációka HuWN-ben Antonímia also_see: hasonló jelentésű központi synset similar_to: hasonló jelentésű fokális „szatellit” synset middle: hárompólusú melléknevek (alsó-felső-középső)

  20. Főnevek és melléknevek közti relációk a HuWN-ben pertains_to: adott főnév melléknévi, lexikalizált párja (száj – orális) partitions: csak adott (típusú) főnévre vonatkozhat (kialudt – inaktív – aktív vulkán)

  21. Speciális igei relációka HuWN-ben Példa: FELMELEGSZIK is_preparatory_phase_of: előkészítő folyamat (melegszik) is_telos_of: sikerpont (felmelegszik) is_consequent_state_of: utóállapot (meleg)

  22. Egyéb igei relációk Antonímia: elad 1 – megvesz 1 Hipernímia – hiponímia: {szerez 4, kap 5, vesz 7 …} hiponimái bérel 1, megtalál 2, belebotlik 1, kölcsönvesz 1 stb.

  23. Nyelvek közti relációk eq_xpos_synonym: ha az angolban és a magyarban eltérő szófaj fejezi ki ugyanazt a fogalmat, ezért közvetlenül nem feleltethetők meg egymásnak fél (ige) – afraid (melléknév)

  24. Mire jó a WordNet? Szinonimalisták WSD: jelentések előre meg vannak adva Dokumentumosztályozás: szavak közti relációk Többnyelvű IE Gépi(leg segített) fordítás: nyelvek közti megfeleltetések

More Related