260 likes | 355 Views
Traducció, computació, utopia. Anna Aguilar-Amat Departament de Traducció Universitat Autònoma de Barcelona Anna.aguilar-amat@uab.es. IA i TA: els termes. 1956: Es crea el terme Intel·ligència Artificial
E N D
Traducció, computació, utopia. Anna Aguilar-Amat Departament de Traducció Universitat Autònoma de Barcelona Anna.aguilar-amat@uab.es
IA i TA: els termes • 1956: Es crea el terme Intel·ligència Artificial • Intel·ligència de la màquina: la de resoldre problemes vells mitjançant solucions noves • Models inicials determinístics: Pattern Matching • Creativitat en la TA: regles de preferència, criteris estocàstics • Impossibilitat d’un “raonador universal” • ‘Trinxat’ de problemes
Intelligere • De legere, elegir, escollir entre diverses opcions • Aparell lògic: Conjunt de dades, procés deductiu, obtenció d’un resultat. • Metàfora de l’ordinador com a cervell: ajuda a destriar les estructures del processos. • Intel·ligència humana: les ‘ocurrències’ sorgeixen de processos no deductius. • Després de la IA: • Persones: processadors d’informació • Naturalesa: informació que ha de ser processada
Traducere • Problemes que no es solucionen amb el càlcul • Usuari de la TA: Ha de tenir la intel·ligència de saber quines coses no seran processades • Camps sens innovació (meteorologia): processables • Patrons repetits, especialitat, especificació • TA: Sistema expert que processa un altre sistema expert, el llenguatge • Top-down vs. Bottom-up • ¿Té unitats mínimes el significat?
Cronologia • 1941 (Ginebra, Monterrey) • 1965 Taum-Meteo • 1966 ALPAC nega la FAHQTUT • 1976 Europa compra SYSTRAN (anglès vs. rus i francès) • 1990 Fi d’EUROTRA • 1993 Fi d’ATLAS • Privatització de la investigació • EEUU manté la inversió de la NASA
Unitat de significat, unitat de Traducció • Com construïm el significat? Com volen els ocells? • Percepció, llenguatge, cognició • El significat no és un ‘nivell superior’ al fonètic o al morfosintàctic • Semàntica: omnipresent, relativa al/s sistema/es • Unitat de Traducció: sorgeix de les possibilitats comparatives des sistemes • 1997: La Traducció s’independitza de la Lingüística
Història d’un concepte i la seva TA • Ordinador de cinquena generació (anys 90) • 1. Anàlisi morfosintàctica: assignació de categoria gramatical als components. Heurística. • Creació d’un Multi_Word_Unit (MWU). En el primer estadi evita l’ambigüitat estructural i la sobregeneració. • Però: ... Els ordinadors denominats de cinquena generació... • Assignació d’una estructura
El subllenguatge • Assignació manual del patró sintàctic • Identificació automàtica de les col·locacions • Estratègia 1: • lematització • extracció de patrons N+A, N+prep+N... • Càlcul d’adjacència: • Categories tancades (articles, preposicions, etc.) • Reutilització de les unitats desambigüades • Estratègia 2: estadística
Estratègia 2: estadística • Informació mútua entre dos events • Binomis que poden estar separats • Smadja (1992) • Rellevància de las associacions en virtut de la distància, intensió, extensió respecte de la frequència de coaparició • També en textos paral·lels aliniats • Productes derivats: • OCP (Oxford Concordance Program) • TACT (universidad de Toronto)
El context social • Ordinador de cinquena generació -> pentium • Comportament general dels termes: • 1er Anatomia descriptiva • Metamorfosi a formes reduïdes o analògiques • Es. Carretilla hidráulica de elevación de horquilla -> toro • Petita i mitjana empresa -> PIME • Processador esclau -> servidor • Conflicte entre la traducció necessària i la consolidació per l’ús
Ontologies • Universitat de Nou Mèxic (Sergei Nirenburg, http://crl.nmsu.edu/) • Conceptes: processos, ents, propietats • Selecció dels significats propers en l’arbre • La multiplicació de grups d’immigrants... • La multiplicació de grups... (matemàtiques) • No arriba als conceptes més especialitzats: ull posterior lateral (anatomia de l’aranya) • Traducció paraula a paraula ¿? Aigua física metàl·lica <- aigua mineral natural (grec)
BACUS (Base de Coneixement Universitari) • Facultat de Traducció i d’Interpretació • 4º curs (i darrer). Olimpíada terminològica • Textos originals i homogenis comparables (3 llengües) • MultiTerm Windows • CINLI (Coordinadora Interuniversitària per a la Coordinació Lingüística i Informàtica) • Criteris: relativitat conceptual, exclusió de la gramàtica, navegació.
Relativitat conceptual (Conklin, 1955, Berlin&Kay, 1969, Leech 1974) • [Hanunoo] marara • [Català] marró specific • [Català] vermell specific • [Català] taronja specific [Català] marró [Hanunoo] marara generic [Català] vermell [Hanunoo] marara generic [Català] taronja [Hanunoo] marara generic
Subordinació gramatical • Es relativitza la importància de la categoria gramatical: ex. verbs i noms predicatius són considerats sinònims conceptuals. • Les entrades poden ser una oració o un sintagma o un terme simple, i tenir com a equivalent qualsevol d’aquestes coses.
Atomització del coneixement i navegació conceptual • Relacions lògiques • Relacions ontològiques • Relacions infralògiques • Relacions analògiques • Relacions supralògiques • Relacions argumentals
Història d’una utopia • Califòrnia, Les Amazones, Martinica.. La cerca de la terra de les dones soles. • Segle XV: progrés tècnic (navegació), guerres de la Reconquesta i el control del Mediterrani, literatura de ficció • Segle XX: progrés tècnic (revolució digital), Segona Guerra Mundial i Guerra Freda, literatura de ficció científica • Sentiment utòpic, atzar, necessitat
La vella utopia • Segona Guerra Mundial: revolució industrial -> control dels mercats • Traductors: pocs, lents, ambigus • Objectiu: substituir al traductor humà per protegir l’ideal democràtic i el sistema capitalista. • Ideals utòpics: minusvàlues compensades gràcies a l’avenç tecnològic, accés dels països pobres a la revolució tecnològica
La nova utopia • Difusió del correu electrònic -> més TA • Usuaris no lingüístics: traduccions urgents, versions preliminars, cop d’ull als continguts. • Determinisme tecnològic? Relació entre societat, tecnologia, economia, naturalesa. • Martin Kay: la màquina pot traduir el que és mecànic i rutinari (utopia) • UE: les despeses de traducció són el 50% de la despesa administrativa? (necessitat) • 1 euro per contribuïent
Globalització • Darrers 30 anys: s’ha produït més informació que en els 5.000 anys anteriors • Traducció literària: 3% • Traduccions diplomàtiques, administratives, comercials, tècniques... ¿mecàniques i rutinàries? • Producció ‘textual’ mundial: llengües de tradició oral, llengües que no tenen accés a la tecnologia • TA per un text jurídic = ¿model jurídic únic? • Utopia multiculturalista
Multiculturalisme • Cultura és el procés de perfeccionament de individus que s’obté gràcies a l’esperit objectivat pel treball històric de l’espècie humana. (Simmel, 1911) • The most important question that we can ask, is wether there is a permanent standard, by which we can compare one civilisation with another, and by which we can make some guess at the improvement or decline of our own. (Eliot, 1962)
Utilitat de la TA • Plurilingüisme igualitari i sostenible • Estandardització de llengües minoritzades • Rentabilitat en la TA de cultures properes • Sense privar-les dels seus trets diferenciadors • Quan hi ha un corrector humà ‘veterà’ • Com complement de la TAO • TA i TAO haurien de deixar de diferenciar-se • Ordinador+Persona: intel·ligència deductiva+creativa
Condicions d’un text • Per ser traduït automàticament (www.automatictrans.es) • Evitar frases llargues, l’abundància de preposicions, les frases idiomàtiques, els col·loquialismes, les paraules espaiades o en majúscules, abreviatures inventades • Construir frases completes i en activa • Utilitzar denominacions idèntiques per el mateix concepte
El concepte d’automàtic • Automàtic = Que funciona sense la intervenció de l’home de començament a fi (GEC) • Automació = aplicació d’automatismes per a que gairebé tot o tot el procés de producció augmenti la rentabilitat sense que disminueixi la qualitat • Marvin Minsky (1995): una màquina intel·ligent administra una varietat de recursos. Teoria de la societat de la ment. • Societat = Computadora • Memòries de traducció • Empreses de traducció
Puzzle de disciplines • 1993 La Lingüística s’independitza de la Filologia • Lingüística teòrica vs. Lingüística aplicada (validable por mitjà d’eines) • Lingüística Computacional • Criteris d’avaluació (Flickinger) • 1997 La Traducció s’independitza de la Lingüística • Intel·ligència Artificial i Ciència Cognitiva • TA: ens diu el que es pot processar i el que no respecte del llenguatge i la cultura
Teoria de la Traducció i TA • Nivells de dificultat: • Morfosintàctic • Lèxico-semàntic • Pragmàtica (graus de localització) • Conversió d’unitats i termes • Conceptes en context • Creències i inferències • Absència de referent • Organització del discurs
Localització, un exemple • English text (NMSU laundry, drinkable water machine): • Center gallon container on top shelf • Note: gallon = 3’785 l (USA) • 4’546 (UK) • Spanish translation (NMSU laundry, drinkable water machine): • Centro galon contenido sobre la repisa • Correct translation: • Centre la garrafa de un galón sobre la repisa contenedor (basura)