1 / 61

Elaboração de glossários confiáveis para o tradutor a partir de corpora

Elaboração de glossários confiáveis para o tradutor a partir de corpora . Stella E. O. Tagnin (DLM/USP) Elisa Duarte Teixeira (doutorado / USP) SBS - Encontro de Férias 22/01/2009. Esta apresentação:. Necessidades do tradutor Lingüística de Corpus a serviço da tradução

mayes
Download Presentation

Elaboração de glossários confiáveis para o tradutor a partir de corpora

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Elaboração de glossários confiáveis para o tradutor a partir de corpora Stella E. O. Tagnin (DLM/USP) Elisa Duarte Teixeira (doutorado / USP) SBS - Encontro de Férias 22/01/2009

  2. Esta apresentação: • Necessidades do tradutor • Lingüística de Corpus a serviço da tradução • L.C. como abordagem em Terminologia: da lista de palavras-chave à entrada do dicionário técnico bilíngüe • “Mão na massa” • Um exemplo de aplicação: o Vocabulário para Culinária SBS (série 1001 Termos)

  3. Necessidades do Tradutor • Obras de referência • Dicionários técnicos – ferramenta (que pode ser) útil para o tradutor • MAS... • Tradução apenas (listas termo LP  termo LC) • Foco no conceito • Basicamente substantivos e verbos • Outras classes gramaticais e suas fraseologias são desprezadas

  4. Dicionários técnicos • Não oferecem • contextos de uso • colocações e fraseologias • sugestões para casos problemáticos • indicações sobre a preferência de uso • informação sobre o uso em diferentes gêneros e tipologias textuais • O exemplo da tradução culinária

  5. Tradução de receitas • A tradução de receitas envolve: • adaptação das características textuais, que variam de cultura para cultura • adaptação de ingredientes e equipamentos que podem não ser comuns ou, na pior das hipóteses, não existirem na cultura e/ou língua de chegada • Fortes marcas culturais – religião, sociedade, costumes, tabus, etc. • Parece simples, mas não é! Problemas de tradução são comuns

  6. Aceita uma fatia?

  7. Uma pitadinha de… humor

  8. Não é assim que se diz... • Translationese • “10 chocolates chips meio-amargos” (= gotas de chocolate meio amargo) • “1/2 xícara de chá de suco de lima” (lime = limão (tahiti) / lemon = limão siciliano) • “1 abacate grande maduro, sem semente e sem casca” (abacate tem ‘caroço’!) • pimenta-do-reino recém-moída (moída na hora)

  9. O tradutor • é um PRODUTOR DE TEXTOS • precisa de: • EQUIVALENTE – tradução • CONTEXTO – exemplo de uso • CONVENCIONALIDADE – padrões lingüísticos e textuais • Informações sobre a TIPOLOGIA TEXTUAL • Especificidades da CULTURA Lingüística de Corpus

  10. O que é um corpus? (1) Conjunto de documentos, dados e informações sobre determinada matéria. (3) Conjunto de materiais significantes (enunciados lingüísticos, capas de revistas) constituído com vistas à análise semiológica. (Aurélio Eletrônico)

  11. Corpus para a L.C. Coletânea de textos autênticos em formato eletrônico destinada à pesquisa, compilada segundo critérios específicos, considerada representativa de uma língua (ou da parte que se pretende estudar) • Lingüística de Corpus: • Abordagem empirista que considera a linguagem como um sistema probabilístico (provável vs. possível) • Estudos baseados em exemplos reais da língua em uso

  12. Tipos de Corpora • Corpus de estudo • Quanto à língua • monolíngües • bilíngües • multilíngües • Quanto à composição • língua geral: jornalísticos e literários • língua de especialidade: técnicos • mistos

  13. Tipos de Corpora • Corpora paralelos: • originais + respectiva(s) traduç(ão/ões) • Corpora comparáveis: • originais em duas ou mais línguas (Ex: 50 receitas de bolo em português e 50 em inglês) • Corpus de referência: • língua geral (Ex: Lácio-Ref, Corpus Brasileiro, ANC, Brown) • variedade de gêneros, registro, autores • serve como termo de comparação

  14. Enfim, os corpora permitem... • examinar uma grande quantidade de ocorrências • de linguagem autêntica • de uma só vez • por meio de CONCORDÂNCIAS E descobrir • padrões lexico-gramaticais • prosódia semântica

  15. O que é uma concordância? • Lista de todas as ocorrências da palavra de busca em contexto • KWIC: “Key Word In Context” • em geral centralizada • Leitura vertical: permite identificar padrões lexico-gramaticais • Leitura horizontal: permite identificar colocados e diferentes sentidos

  16. Cobuild: V + “or” + V to protest Japan's continued whaling, call or write to the Japanese Embassy, 101-104 the police know of anything suspicious you see or hear, you are helping to reduce in breast tissue long before a woman can feel or notice anything unusual or before Neither does Midlands Electricity plc confirm or deny any of the claims made in Uvistat Sun Cream spf15), so the sun won't burn or damage her skin. Unfortunately, aircraft are a scourge to those who live, work or relax in the country. [p] For several which you lay brick or stone paths can shorten or increase their apparent distance. was pressed by mps of all parties to confirm or deny reports that the cost of in town. Except for Ella, no one would know or care where Sue Anne Norton humankind or the goodwill of God can do to avert or transform the effects of was my experience that a patient's will to live (or die) made a substantial difference be inadequate because it was unable to predict or suggest how managers' credit cards are often useless. You can't bribe or barter with plastic, sometimes can't alcohol or other sedatives. 4. Not drive or operate machinery whilst under the should use any opportunity that he has to visit or contact friends or relations he has two major companies and their decisions can make or break small publications. [p] years are very important and whether I stay or go remains to be seen. [p] But I've

  17. Cobuild: V + “or” + V to protest Japan's continued whaling, call or write to the Japanese Embassy, 101-104 the police know of anything suspicious you see or hear, you are helping to reduce in breast tissue long before a woman can feel or notice anything unusual or before Neither does Midlands Electricity plc confirm or deny any of the claims made in Uvistat Sun Cream spf15), so the sun won't burn or damage her skin. Unfortunately, aircraft are a scourge to those who live, work or relax in the country. [p] For several which you lay brick or stone paths can shorten or increase their apparent distance. was pressed by mps of all parties to confirm or deny reports that the cost of in town. Except for Ella, no one would know or care where Sue Anne Norton humankind or the goodwill of God can do to avert or transform the effects of was my experience that a patient's will to live (or die) made a substantial difference be inadequate because it was unable to predict or suggest how managers' credit cards are often useless. You can't bribe or barter with plastic, sometimes alcohol or other sedatives. 4. Not drive or operate machinery whilst under the should use any opportunity that he has to visit or contact friends or relations he has two major companies and their decisions can make or break small publications. [p] years are very important and whether I stay or go remains to be seen. [p] But I've

  18. Cobuild: “confirm or deny” any way. Neither does Midlands Electricity plc confirmor deny any of the claims Wakeham was pressed by mps of all parties to confirmor deny reports that the cost and flown to America. Dr Swire has refused to confirmor deny reports that the political prisoners. He has always refused to confirmor deny whether he's a J. Dore which the Princess refused either to confirmor deny she wore during the Household had seen them, it was impossible to confirmor deny that they were any of the reason and no one is prepared to confirmor deny that the Princess forced to show on his face that would either confirmor deny. When's the next time merely smiled and nodded and refused to confirmor deny anything. Of the three were, ended there and then. Neither side will confirmor deny that they took place [p] The Prison Service yesterday refused to confirmor deny whether women were the Hong Kong police were last night able to confirmor deny the report, which by Lord Stevens of Ludgate, has refused to confirmor deny claims that it is soon. [p] The Agriculture Minister refused to confirmor deny reports that he had s Playboy magazine Elizabeth Ward refuses to confirmor deny whether she has [p] But Downing Street later refused to confirmor deny whether Maxwell's

  19. Cobuild: “confirm or deny” any way. Neither does Midlands Electricity plc confirmor deny any of the claims Wakeham was pressed by mps of all parties to confirmor deny reports that the cost and flown to America. Dr Swire has refused toconfirmor deny reports that the political prisoners. He has always refused toconfirmor deny whether he's a J. Dore which the Princess refused either to confirmor deny she wore during the Household had seen them, it was impossible to confirmor deny that they were any of the reason and no one is prepared to confirmor deny that the Princess forced to show on his face that would either confirmor deny. When's the next time merely smiled and nodded and refused toconfirmor deny anything. Of the were, ended there and then. Neither side will confirmor deny that they took place [p] The Prison Service yesterday refused toconfirmor deny whether women were the Hong Kong police were last night able to confirmor deny the report, which by Lord Stevens of Ludgate, has refused toconfirmor deny claims that it is soon. [p] The Agriculture Minister refused toconfirmor deny reports that he had s Playboy magazine Elizabeth Ward refuses toconfirmor deny whether she has [p] But Downing Street later refused toconfirmor deny whether Maxwell's

  20. Cobuild: “confirm or deny” any way.Neitherdoes Midlands Electricity plc confirmor deny any of the claims Wakeham was pressed by mps of all parties to confirmor deny reports that the cost and flown to America. Dr Swire has refused toconfirmor deny reports that the political prisoners. He has always refused toconfirmor deny whether he's a J. Dore which the Princess refused either to confirmor deny she wore during the Household had seen them, it wasimpossibleto confirmor deny that they were any of the reason and no one is prepared to confirmor deny that the Princess forced to show on his face that would either confirmor deny. When's the next time merely smiled and nodded and refused toconfirmor deny anything. Of the were, ended there and then. Neitherside will confirmor deny that they took place [p] The Prison Service yesterday refused toconfirmor deny whether women were the Hong Kong police were last night able to confirmor deny the report, which by Lord Stevens of Ludgate, has refused toconfirmor deny claims that it is soon. [p] The Agriculture Minister refused toconfirmor deny reports that he had s Playboy magazine Elizabeth Ward refuses toconfirmor deny whether she has [p] But Downing Street later refused toconfirmor deny whether Maxwell's

  21. Corpora na Tradução Os corpora: • podem ser construídos de acordo com as necessidades do tradutor • podem ser constantemente atualizados • conferem segurança ao tradutor na escolha do termo a empregar • fornecem exemplos autênticos de uso  naturalidade para o texto traduzido

  22. Corpora e terminologia bilíngüe L.C. como metodologia corpora privilegiam textos ricos em contextos definitórios parte-se de listas de substantivos e verbos da área – conceitos foco na estruturação do conhecimento entradas: termos e fraseologias terminológicas Glossário de Química: produto de alunas do Cetrad Ana Julia Perrotti-Garcia Rozane Rodrigues Rebecchi (2007)

  23. Nossa proposta L.C. como abordagem corpora: privilegiam textos mais usados pelos especialistas parte-se da lista de palavras-chave do corpus foco no co-texto, na freqüência e na co-ocorrência entrada: padrões de frequência significativa nos corpora L.C. e terminologia bilíngue

  24. Metodologia Compilação de corpora - coleta de textos eletrônicos da internet, CDs, etc. com offline browsers manualmente (um a um) Ferramentas de Análise (WST, AntConc, etc.) Lista de palavras (Wordlist) Lista de palavras-chave (Keyword List) – comparação com corpora de referência: Lácio-Ref (NILC/USP), Corpus Brasileiro (LAEL-PUC) BNC, ANC, Jornalístico (DIY) Concordâncias (Concordance)

  25. Metodologia • Compilação de corpora a partir da internet • Ferramentas de análise: WordSmith Tools, AntConc • Lista de palavras (Wordlist) • Lista de palavras-chave (Keyword List) – comparação com corpora de referência: • Lácio-Ref (português) • Brown (inglês) • Concordâncias

  26. Mão na massa Exercício: • Análise de linhas de concordância para identificação de colocações e fraseologias. • Insuficiência renal • Português: rins / renal • Inglês: kidney / renal • Culinária • Português: finely • Inglês: picad*

  27. Termos em inglês failure chronic renal end-stage disease ESRD

  28. Termos em inglês prostaglandins function renal insufficiency damage failure (36x)

  29. failure transplant patient(s) kidney transplantion allograft(s) function

  30. chronic damage kidney original disease

  31. Outros colocados de kidney • recipients- kidneytransplants • recipients of kidneytransplants • kidneytransplantrecipients • preservation of kidneyfunction • contraindications ????

  32. Termos em português - renal insuficiência renal insuficiência renal aguda insuficiência renal crônica insuficiência renal crônica(IRC) insuficiência renal crônicaterminal insuficiência renal crônicaterminal (IRCT)

  33. Termos em português - renal função renal função renalresidual-“perda”, “sem” substituição renal substituição renal extracorpórea técnica desubstituição renal novos procedimentosdesubstituição renal terapiascontínuasdesubstituição renal médodoscontínuosdesubstituição renal transplante renal bem-sucedido

  34. Termos em português - rins rins anômalos rins primitivos remoção dosrins primitivos rins policísticos rins em bloco “de quebra”  rim transplantado

  35. Rins – outros candidatos a termos Rins hidronefróticos Rins nativos Rins antigos

  36. Um exemplo de aplicação • Dicionário: • Vocabulário para Culinária • Autoras: • Elisa D. Teixeira e Stella E. O. Tagnin • Línguas / direção: • Inglês  Português • Publicação: • 2008, pela SBS • Série: 1001 Termos

  37. Metodologia Compilação de corpora a partir da internet – usando offline browsers receitas originalmente escritas em português brasileiro e inglês (+ britânico) aprox. 1,5 milhão de palavras em cada língua Lista de palavras (Wordlist) Lista de palavras-chave (Keyword List) – comparação com corpora de referência: Lácio-Ref (português) Brown (inglês)

  38. Seleção das entradas • Dentre as 300 primeiraspalavras-chave em inglês, selecionamos: • Substantivos; Verbos; Adjetivos; Advérbios • Glossário não exaustivo (chayote, starfruit não entram) • Pesquisa no corpus usando a ferramenta Concord do WordSmith Tools (Scott, 1997) • identificação de padrões em LP • Privilegiamos: • palavras de alta freqüência: flour, bake • Colocações:chopping board, ground cloves, finely sliced • Padrões:white (bread), crusts removed; cut the butter into cubes; freshly grated parmesan cheese

  39. Metodologia Busca de equivalentes gerar linhas de concordâncias para tradução prima facie da palavra-chave levantar padrões de associação recorrentes (inclusive uso de pronomes, artigos, ordem na frase etc.) observar características textuais mais presente em uma parte específica da receita? típico de certas preparações (doces, salgadas, assadas etc.)? identificar possíveis problemas de sinonímia, homonímia, polissemia (cream – verbo / substantivo) atestar o uso dos candidatos a equivalentes em corpora

  40. N WORD 1 MINUTES 2 TBSP 3 ADD 4 MINS 5 OIL 6 UNTIL 7 CHOPPED 8 PAN 9 OZ 10 BUTTER 11 INGREDIENTS 12 HEAT 13 SALT 14 SUGAR 15 PEPPER 16 COOKING 17 COOK 18 TSP 19 AND 20 METHOD 21 SERVES 22 SERVE 23 CREAM 24 SAUCE 25 TIME 26 PREPARATION 27 OVEN 28 FLOUR 29 GARLIC 30 OLIVE 31 STIR 32 INTO 33 JUICE 34 MIXTURE 35 BOWL N WORD 1 SOPA 2 SAL 3 CHÁ 4 COLHERES 5 XÍCARA 6 MINUTOS 7 PREPARO 8 COLHER 9 INGREDIENTES 10 COLOQUE 11 FOGO 12 MANTEIGA 13 LEITE 14 DEIXE 15 ÁGUA 16 DE 17 FARINHA 18 LEVE 19 AÇÚCAR 20 MOLHO 21 MISTURE 22 PANELA 23 AZEITE 24 RETIRE 25 ATÉ 26 JUNTE 27 FORNO 28 CEBOLA 29 CREME 30 G 31 MASSA 32 ACRESCENTE 33 ALHO 34 TEMPERATURA 35 QUENTE

  41. Metodologia • Casos de não-equivalência • Busca pelos colocados • Busca pelo contexto • Diferenças culturais: • Sugestão de adaptação / nota de tradução • No futuro: • repetir o procedimento para a outra língua (e não simplesmente inverter a lista de entradas)

  42. Exemplo • advérbio finely: • advérbio mais recorrente no corpus (+ de 3.000 ocs.) • primeiro advérbio entre as palavras-chave • grande número e variedade de colocados

  43. Colocados do advérbio chopped (2.528 oc) sliced (443 oc) finely shredded (85 oc) chop (167 oc) diced (379 oc) grated (280 oc)

  44. Busca por equivalentes clusters de “finamente” finely (2.987 oc.) = finamente (337 oc.)? Não-equivalência (finely ≠ finamente) Método indireto: chop = picar colocados de “pique/picad*” no corpus de português

  45. Resultados para picad* • advérbios com que “picad*” mais co-ocorre: • “bem” (621 ocorrências): “bem picada”, “bem picados”, “bem picadinho” etc. • “picadinh*” = 396 ocorrências (sendo 28 de “bem picadinh*”) • melhores equivalências para finely chopped “bem picad*” ou “picadinh*”

  46. Alguns exemplos do corpus

More Related