100 likes | 251 Views
Jezikovne tehnologije in nove metode. Špela Arhar Amebis, d . o. o ., Kamnik. dialoški sistemi. prepoznava in sinteza govora. slovnično pregledovanje besedil. povzemanje besedil. strojno prevajanje. iskanje informacij. 5. napake na različnih mestih. analiza napak. 6.
E N D
Jezikovne tehnologije in nove metode ŠpelaArhar Amebis, d. o. o., Kamnik
dialoškisistemi prepoznava in sinteza govora slovnično pregledovanje besedil povzemanje besedil strojno prevajanje iskanje informacij Jezikovne tehnologije in nove metode, 6. 2. 2009
5 napake na različnih mestih analiza napak Jezikovne tehnologije in nove metode, 6. 2. 2009
6 testiranje nabora učnih algoritmov ter učnih parametrov za avtomatsko identifikacijo pravilne oznake – 79.73 % uspešnost večji učni korpus ustrezno zasnovan oblikoslovni leksikon Rupnik, Grčar, Erjavec, IS-LTC 2008 Jezikovne tehnologije in nove metode, 6. 2. 2009
7 skladenjski razčlenjevalnik učenje statističnih modelov za avtomatsko označevanje Oznake na štirih nivojih: lema oblikoskladenjski nivo skladenjski nivo lastna imena Jezikovne tehnologije in nove metode, 6. 2. 2009
8 <WordForm> <featatt="zapisOblike" val="izdelat"/> <featatt="oblika" val="namenilnik"/> </WordForm> <WordForm> <featatt="zapisOblike" val="izdelal"/> <featatt="oblika" val="deležnik"/> <featatt="spol" val="moški"/> <featatt="število" val="ednina"/> </WordForm> Leksikon SSJ Jezikovne tehnologije in nove metode, 6. 2. 2009
okrog 100.000 (premišljeno izbranih) enot • specifikacije z DTD-ji za xml • za različne namene <WordForm> <feat att="število" val="ednina"/> <feat att="sklon" val="rodilnik"/> <FormRepresentation> <feat att="zapisOblike" val=“okvirja"/> <feat att="norma" val="variantno"/> <feat att="pogostnost" val="3000"/> </FormRepresentation> <FormRepresentation> <feat att="zapisOblike" val=“okvira"/> <feat att="norma" val="variantno"/> <feat att="pogostnost" val="3000"/> </FormRepresentation> </WordForm> 9 • Vzorec prinaša informacijo o: • - zaporednemmestu, na katerem se nahajaposameznaenotaprizapisuvečbesedneenote, • - ali se enotazapisuje z velikoali z malozačetnico, • - ali se kot del lastnegaimenaenotapripregibanjuobnašaenakokotnjenenobesednileksikonski referent, • - ločilo, kiločujeenoti ("presledek", "vezaj","pomišljaj"), • kateri element v vzorcu predstavlja jedro zveze. Leksikon SSJ Jezikovne tehnologije in nove metode, 6. 2. 2009
10 Hvala za pozornost! Jezikovne tehnologije in nove metode, 6. 2. 2009