1 / 9

Itzulpen automatikoaren: bi eredu

Itzulpen automatikoaren: bi eredu. Arau bidez esaldien egiturak parekatu (Chomsky) esaldien esanahia baliokide ( Leibniz, Frege, Montague) Analogi bidez testuen baliokidetasunaren hiru alderdi: semantiko pragmatiko estilistiko. Adibideak: PAHO. ¿Qué trabajo queda por realizar?

kaoru
Download Presentation

Itzulpen automatikoaren: bi eredu

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Itzulpen automatikoaren: bi eredu • Arau bidez • esaldien egiturak parekatu (Chomsky) • esaldien esanahia baliokide (Leibniz, Frege, Montague) • Analogi bidez • testuen baliokidetasunaren hiru alderdi: • semantiko • pragmatiko • estilistiko Hiztek, Eibar 2003

  2. Adibideak: PAHO • ¿Qué trabajo queda por realizar? • PAHO: What work remains to be carried out? • Eskuz: What is left to do in this field? • Pero pese a que todavía quedan flecos por subsanar, la tecnología está preparada para ofrecer una amplia gama de servicios. • PAHO: But despite the fact that still fringes remain to be corrected, the technology is prepared for offering a broad range of services. • Eskuz: But despite some minor remaining issues, the technology today is ready to offer a wide range of services. Hiztek, Eibar 2003

  3. Adibideak: PAHO (2) • Por ser el lenguaje oral la forma más espontánea y natural de comunicación entre las personas, la tecnología del habla es percibida como un factor determinante en la mejora de la interacción entre personas y ordenadores. • PAHO: To be the oral language the most spontaneous and natural form of communication among the people, the technology of the speech is perceived as a determining factor in the improvement of the interaction between people and computers. • Eskuz: Because oral language is the most spontaneous and natural form of communication among people, speech technology is perceived as a determining factor in achieving better interaction with computers. Hiztek, Eibar 2003

  4. Esanahia eta estiloa • Certificado de empadronamiento • enpadronaturik daudela esan dezan Egiaztagiria • Denegar la autorización solicitada por don X para la construcción de una vivienda en el término municipal de Y , por incumplir lo dispuesto en el artículo 56 de las Normas Subsidiarias de Planeamiento de dicho municipio. • X jaunak Yko udal mugartean etxebizitza bat eraikitzeko baimena eskatu zuen; baina eskabide horri uko egin zaio, udal horretako sorospidezko arauetako 56. art.an xedatutakoa ez betetzeagatik. Hiztek, Eibar 2003

  5. SARE-Bi: Dokumentu eleanitzak kudeatzeko sistema • Aurreko lana • LEGE-Bi corpusa (1995-2001) • TEIz markatutako aldizkari elebidunak (~3 M. hitz, LEGEBiDUNA eta XTRA-Bi proiektuak) • SGML  XML • XML-Bi proiektua (2000-2002) • Egoeraren azterketa (UD corpusa) • Zehazpenak • Baliabideak (LEGE-Bi+, SARE-Bi, lanabesak) • Prozedurak (EFQM) • http://www.deli.deusto.es/SareBi Hiztek, Eibar 2003

  6. SARE-Bi: Dokumentu eleanitzak kudeatzeko sistema • Corpusa kudeatzeko aukerak: • TEI/XML + XSLT + JavaScript • XML Query Engine, SQL, etc. • XML=Web, web-servers: • Microsoft .Net • WebSphere • ZOPE: • Open Source (www.zope.org) • Code&Syntax (www.codesyntax.com) • Localizer (www.j-david.net/localizer/) Hiztek, Eibar 2003

  7. SARE-Bi: Dokumentu eleanitzak kudeatzeko sistema ZOPE serbitzaria: • XML/TEI  Z.objects • Z.objets-en kudeaketa • Z.objects • TEI • TMX (WordFast, Déjà-Vu, etc.) • TXT Hiztek, Eibar 2003

  8. AutomaticTrans: ATeus • Velocidad de traducción • Capacidad de mejora de la calidad por el propio lingüista • Integración con otros sistemas (gestión de contenidos, publicadores, transaccionales, e-mail, chat, forum...) • Segmentación corpus bilingüe grande • Definición de tipología y construcciones • Categorización de los segmentos • Etiquetación de lemas • - Conjugación de verbos • - Construcción de reglas con un álgebra precisa. Hiztek, Eibar 2003

  9. LEGE-Bi <teiHeader>, <front>(y 4) • <teiHeader> <fileDesc> <encodingDesc> <classDecl> <taxonomy>...</taxonomy> • <text> <front> <DocDate>...</DocDate> <DocAuthor>...</DocAuthor> <head type="place">...</head> <head type"DepSup">...</head> <head type"DepInf">...</head> Hiztek, Eibar 2003

More Related