90 likes | 222 Views
Itzulpen automatikoaren: bi eredu. Arau bidez esaldien egiturak parekatu (Chomsky) esaldien esanahia baliokide ( Leibniz, Frege, Montague) Analogi bidez testuen baliokidetasunaren hiru alderdi: semantiko pragmatiko estilistiko. Adibideak: PAHO. ¿Qué trabajo queda por realizar?
E N D
Itzulpen automatikoaren: bi eredu • Arau bidez • esaldien egiturak parekatu (Chomsky) • esaldien esanahia baliokide (Leibniz, Frege, Montague) • Analogi bidez • testuen baliokidetasunaren hiru alderdi: • semantiko • pragmatiko • estilistiko Hiztek, Eibar 2003
Adibideak: PAHO • ¿Qué trabajo queda por realizar? • PAHO: What work remains to be carried out? • Eskuz: What is left to do in this field? • Pero pese a que todavía quedan flecos por subsanar, la tecnología está preparada para ofrecer una amplia gama de servicios. • PAHO: But despite the fact that still fringes remain to be corrected, the technology is prepared for offering a broad range of services. • Eskuz: But despite some minor remaining issues, the technology today is ready to offer a wide range of services. Hiztek, Eibar 2003
Adibideak: PAHO (2) • Por ser el lenguaje oral la forma más espontánea y natural de comunicación entre las personas, la tecnología del habla es percibida como un factor determinante en la mejora de la interacción entre personas y ordenadores. • PAHO: To be the oral language the most spontaneous and natural form of communication among the people, the technology of the speech is perceived as a determining factor in the improvement of the interaction between people and computers. • Eskuz: Because oral language is the most spontaneous and natural form of communication among people, speech technology is perceived as a determining factor in achieving better interaction with computers. Hiztek, Eibar 2003
Esanahia eta estiloa • Certificado de empadronamiento • enpadronaturik daudela esan dezan Egiaztagiria • Denegar la autorización solicitada por don X para la construcción de una vivienda en el término municipal de Y , por incumplir lo dispuesto en el artículo 56 de las Normas Subsidiarias de Planeamiento de dicho municipio. • X jaunak Yko udal mugartean etxebizitza bat eraikitzeko baimena eskatu zuen; baina eskabide horri uko egin zaio, udal horretako sorospidezko arauetako 56. art.an xedatutakoa ez betetzeagatik. Hiztek, Eibar 2003
SARE-Bi: Dokumentu eleanitzak kudeatzeko sistema • Aurreko lana • LEGE-Bi corpusa (1995-2001) • TEIz markatutako aldizkari elebidunak (~3 M. hitz, LEGEBiDUNA eta XTRA-Bi proiektuak) • SGML XML • XML-Bi proiektua (2000-2002) • Egoeraren azterketa (UD corpusa) • Zehazpenak • Baliabideak (LEGE-Bi+, SARE-Bi, lanabesak) • Prozedurak (EFQM) • http://www.deli.deusto.es/SareBi Hiztek, Eibar 2003
SARE-Bi: Dokumentu eleanitzak kudeatzeko sistema • Corpusa kudeatzeko aukerak: • TEI/XML + XSLT + JavaScript • XML Query Engine, SQL, etc. • XML=Web, web-servers: • Microsoft .Net • WebSphere • ZOPE: • Open Source (www.zope.org) • Code&Syntax (www.codesyntax.com) • Localizer (www.j-david.net/localizer/) Hiztek, Eibar 2003
SARE-Bi: Dokumentu eleanitzak kudeatzeko sistema ZOPE serbitzaria: • XML/TEI Z.objects • Z.objets-en kudeaketa • Z.objects • TEI • TMX (WordFast, Déjà-Vu, etc.) • TXT Hiztek, Eibar 2003
AutomaticTrans: ATeus • Velocidad de traducción • Capacidad de mejora de la calidad por el propio lingüista • Integración con otros sistemas (gestión de contenidos, publicadores, transaccionales, e-mail, chat, forum...) • Segmentación corpus bilingüe grande • Definición de tipología y construcciones • Categorización de los segmentos • Etiquetación de lemas • - Conjugación de verbos • - Construcción de reglas con un álgebra precisa. Hiztek, Eibar 2003
LEGE-Bi <teiHeader>, <front>(y 4) • <teiHeader> <fileDesc> <encodingDesc> <classDecl> <taxonomy>...</taxonomy> • <text> <front> <DocDate>...</DocDate> <DocAuthor>...</DocAuthor> <head type="place">...</head> <head type"DepSup">...</head> <head type"DepInf">...</head> Hiztek, Eibar 2003