300 likes | 504 Views
Tłumacze i firmy lokalizacyjne w obliczu tłumaczenia maszynowego. Zbigniew Piotrowicz Moravia IT z.piotrowicz@moravia-polska.pl. Drodzy przyjaciele z konferencji
E N D
Tłumacze i firmy lokalizacyjne w obliczu tłumaczenia maszynowego Zbigniew Piotrowicz Moravia IT z.piotrowicz@moravia-polska.pl
Drodzy przyjaciele z konferencji Przekazuję Wam moją prezentację. Pod slajdami znajdują się komentarze; niektóre były już wcześniej, a niektóre dodałem specjalnie dla Was, aby ułatwić odczytanie i interpretację niektórych slajdów. Część danych w prezentacji to informacje ogólnodostępne, ale prosiłbym o zachowanie niektórych slajdów (oceny MT w Microsofcie oraz wyniki analityczne zastosowalności MT w Moravii) do własnych potrzeb i niepublikowanie ich dalej. Dziękuję za zrozumienie. Zbigniew Piotrowicz Notka pokonferencyjna
Program Czym jest tłumaczenie maszynowe (MT) Historia MT Idea, zasady, problemy Zastosowanie w praktyce Przykłady MT a tłumacz (post-editing) Ocena MT Podsumowanie
1. Proces komputerowego tłumaczenia z języka źródłowego na język docelowy z użyciem aplikacji translacyjnych 2. Tłumaczenie będące wynikiem działania takich aplikacji Metody: Tłumaczenie bezpośrednie (zamiana słów i wyrażeń) Analiza składni Powierzchniowy transfer semantyczny (analiza składni + atrybuty dodatkowe, np. znaczeniowe, dnt) Tłumaczenie statystyczne Tłumaczenie oparte na przykładach Metody hybrydowe Czym jest tłumaczenie maszynowe
Wiek XVII – początki koncepcji interlingua, trudno mówić o MT ze względu na brak M Praca Johna Wilkinsa „An Essay towards Real Character and a Philosophical Language” Historia MT
Historia MT • Georges B. Artsrouni, Francja, • rok 1932 (patent w 1933) • Maszyna do zapisywania i wyszukiwaniainformacji; jedna z możliwości obejmowałazapisanie słownika oraz rozbudowaniego o frazy; tłumaczenie na 4 języki Piotr Trojański, ZSRR, (patent w 1933) Prace teoretyczne nad maszyną z pamięcią na szerokiej taśmie perforowanej; tekst źródłowy przed tłumaczeniem opisywany był symbolami opisującymi charakter gramatyczny poszczególnych słów oraz określeniami w esperanto
1954 – system IBM i Uniwersystetu Georgtown (połączenie słownika z regułami gramatycznymi dotyczącymi kolejności wyrazów w zdaniu) 1964 – raport ALPAC o braku perspektyw MT (wolniejsze, gorsze i dwa razy bardziej kosztowne tłumaczenie MT od tradycyjnego) 1968 – SYSTRAN i zimna wojna Lata 70-80 – kolejne systemy bazujące na regułach Koniec lat 80 – pierwsze systemy statystyczne i bazujące na przykładach (IBM Candide) Lata 90-do dziś… (MS – początek prac NLP w 1991 roku; 1999 początek prac nad MT; 2003 Translator 1, oparty na przykładach; 2009 MT->PL) Historia MT
MT jako narzędzie do tłumaczenia tekstów, które nigdy nie byłyby standardowo tłumaczone ze względu na koszty MT jako narzędzie przyspieszające pracę tłumacza MT jako narzędzie obniżające koszty MT ma nie zmniejszyć rynku tłumaczeń,a wręcz przeciwnie Celem użycia MT jest uzyskanie jakości komunikatywnej PRAWDA CZY FAŁSZ? Idea i zasady
Idea, zasady, problemy FAMT & HAMT Preedycja i postedycja Zastosowalność (dokumentacja techniczna, literatura, marketing...) Oczekiwania jakościowe (komunikatywność vs jakość premium) Akceptacja wśród tłumaczy
Homografy/polisemy (wyrazy pisane identycznie, ale o innym znaczeniu) np. pokój (pomieszczenie albo brak wojny); light (rzeczownik, czasownik, przymiotnik, przysłówek) Niejednoznaczności w obrębie języka i między językami: „Kill that man with the hammer”; Bear – miś (pluszowy) czy niedźwiedź Złożona struktura zdań Odmiana (końcówki, rodzaj męski/żeński) Język nieformalny, potoczny, neologizmy, figury retoryczne, idiomy (it's raining cats and dogs=Pada deszcz psów i kotów) Błędy (literówki, interpunkcja) Tagi, znaki specjalne Idea, zasady, problemy C3PO zna 6 milionów form porozumiewania się, tylko Chuck Norris zna wszystkie...
Zastosowanie w praktyce Tłumaczenia prywatne (często darmowe, ogólne zrozumienie tekstu, Google Translator, Microsoft Translator, Bable Fish, translatory w formie aplikacji) Tłumaczenia komercyjne, np. Chrysler obniżył koszty o 35% i zwiększył wydajność tłumaczeń dokumentacji (model HAMT); Microsoft Support (model FAMT; osobne slajdy) Tłumaczenia wewnętrzne (np. wojsko, korporacje) Ukierunkowanie: szeroko pojęte tłumaczenia techniczne (IT, motoryzacja, elektronika...)
Przykład HAMT w MS Office14 UI Pamięć tłumaczeń Silnik SMT Fuzzy >75% <75% Bucket 13+ <75% Bucket 1-12 Jednostki 100% Tłumacz (żywy) Tłumaczenie Źródło
Model z pracy z TM Pamięć HT Pamięć MT Pamięć HT + MT Opcja 1 Tłumacz Tłumaczenie Źródło Opcja 2 Opcja 3 = brak pamięci MT, tłumaczenia w formie pretranslacji bezpośrednio w pliku
FAMT - ocena „resolve rate” (źródło: Chris Wendt, Microsoft corp.)
„Global English” 1. Standardowy styl 2. Prawidłowa interpunkcja 3. Eliminacja długich zdań4. Poprawne użycie wielkich liter 5. Poprawna pisownia (źródło: Chris Wendt, Microsoft corp.)
Wpływ na pracę tłumacza Produktywność tłumaczy dzięki MT Po specjalnym szkoleniu z MT post-editingu (źródło: Chris Wendt, Microsoft corp.)
MT a język polski O14 Pilot O14 FLK5
Kto zgadnie, jak to zostało przetłumaczone? Przykład 1
The forces of the Teutonic Knights were decisively defeated in the battle, but were able to defend their castles and retain most of their territories despite the long-term consequences they suffered as a result of losing the battle. The order never recovered its former power, and the financial burden of the ensuing reparations eventually caused a rebellion of cities and landed gentry. Przykład (długie zdania, tekst ogólny) Spuśćmy zasłonę milczenia... (English Translator 3.0) Siły Krzyżaków były zdecydowanie pokonane w bitwie, ale mogły obronić ich zamki i zachować najbardziej z ich terenów pomimo długoterminowych konsekwencji, z powodu których cierpieli w efekcie z przegrywania bitwy. Porządek nigdy nie odzyskał swojej dawnej mocy, i obciążenie finansowe wywiązujących się zadośćuczynień ostatecznie spowodowało bunt miast i ziemiaństwa. (translatica.pl) Siły krzyżackie były zdecydowanie pokonany w walce, ale były zdolne do obrony swych zamków i zachować większość ich terytorium, mimo długoterminowe konsekwencje ponieśli w wyniku utraty bitwy. Aby nigdy nie odzyskał dawnej potęgi, a obciążenia finansowe wynikające z odszkodowań wynikających ostatecznie spowodowało bunt miast i ziemiańskiej. (Google Translator) Siły Teutonic Rycerzy zdecydowanego zostali pokonani w bitwie pod, ale byli w stanie bronić swoich zamków i zachowuje większość z ich terytoriów, pomimo długoterminowe skutki one poniesione w wyniku zastosowania utraty bitwy. Kolejność nigdy nie odzyskać swojego byłego energią i obciążeń finansowych z tym reparations ostatecznie spowodował powstanie miast i wyładowanych gentry. (Microsoft Translator)
Przykłady (IT) If you still cannot see the Tree view, it might be because another window pane is in the way. Resize the visible window pane from the left to reveal the Tree view. The Tree View button in the toolbar and in the View menu appears depressed, indicating the Tree view is active. To hide the Tree View, select View>Tree View again. Click the + or - symbols next to the folders in the Tree View to expand or collapse the tree. Jeśli nadal nie widać widoku drzewa, może to być spowodowaneinnym okienku jest w drodze. Resize widoczne okienku z lewej strony, aby odsłonić widok drzewa.Przycisk Widok drzewa na pasku narzędzi w menu Widokpojawia się w depresji, wskazując Widok drzewa jest aktywny.Aby ukryć widoku drzewa wybierz Widok> Widok drzewa ponownie.Kliknij przycisk + lub - symbole obok folderów w widoku drzewa, aby rozwinąć lub zwinąć drzewa. MT
Przykład (tekst marketingowy) Out with the old, in with the new. Sound processesand smart technologyare at the heart of anytruly efficient localization effort. HT MT Się ze starym, z nowym. Sound procesówi inteligentnych technologii w sercu każdego naprawdę skuteczne wysiłki lokalizacji. Żegnamy się z przeszłością, witamy przyszłość. Niezawodne procesyi inteligentne technologie stanowią istotę w pełni efektywnych prac lokalizacyjnych.
It contains the following sections: Select Actions>Update... Use the Replace command to find and replace specific items in the translation project. Put the pointer on a column division. The Modes preference tab displays the following options: Krótkie, proste zdania IT • To zawiera poszły za _brak_tłum_: • Wybrane Operacje > _brak_tłum_... • Użyj Zastąp _brak_tłum_, by znaleźć i zastąpić sprecyzowanych _brak_tłum_ w _brak_tłum_ rzucie. • Położył _brak_tłum_ na rozdzielaniu _brak_tłum_. : (English Translator 3.0; kontekst=IT) • Tryby preferencja naszywka okazuje następujące opcje: (Translatica.pl) • Zawiera on następujące działy: • Działań Wybierz> Update ... • Użyj polecenia Replace, aby znaleźć i zastąpić poszczególne pozycje w projekcie tłumaczenia. • Umieść wskaźnik w sprawie podziału kolumny. • Kartę preferencji tryby są wyświetlane następujące opcje: (Google Translator) • Zawiera on następujące sekcje: • Wybierz polecenie Operacje > Aktualizuj... • Polecenie Zamień służy do znajdowania i zamieniania konkretne elementy w projekcie tłumaczenia. • Umieść wskaźnik myszy na podział kolumny. • Na karcie Preferencje tryby są wyświetlane następujące opcje: (Microsoft Translator)
MT a tłumacz (post-editing) • W dłuższej perspektywie MT jest nieuniknione w większości branż • Nawet jeśli istnieją mocne argumenty przeciw MT z punktu widzenia języka, klienci i tak będą kierować się ceną, a MT obniża ich koszty pomimo dużych nakładów początkowych na technologię • MT jest wyborem klientów, a nie firm lokalizacyjnych i samych tłumaczy (przynajmniej na razie) • Jakość MT wzrasta wraz ze zwiększaniem się zasobów tłumaczeń – stanowi to istotny czynnik rozwojowy MT Post-editing staje się nową formą usługi świadczoną przez tłumaczy
Przeczytać zdanie źródłowe Zrozumieć ogólną treść zdania „Rzucić okiem” na jednostkę MT Decyzja w maks. 2 sek. później Edycja Odrzucenie Zasady posteditingu MT
Złote zasady • Czy bardziej pracochłonne jest tłumaczenie czy edycja MT? • Nawet jeśli zdanie nie jest idealne, użyj go jeśli jest zrozumiałe. • Terminologia powinna być poprawna, nie trać czasu na sprawdzanie jej za każdym razem. • Jeśli tłumaczenie zawiera dużo tagów, skopiuj źródło i poprzeklejaj fragmenty tekstu. • W przypadku dłuższych zdań – oceń 5 pierwszych słów, jeśli brzmią sensownie, oceń 5 ostatnich. • Jeśli zdanie jest poprawne, nie „walcz” z tłumaczeniem, aby było w Twoim stylu. • Nie staraj się zrozumieć dlaczego tłumaczenie MT jest jakie jest.
Oceny tłumaczy • Jednowyrazowe jednostki są w 90% OK - tu nie ma problemu. • Przy pierwszym pliku, gdy nie byłam obeznana jeszcze w terminologii Projecta, MT faktycznie mi pomagało, bo używana terminologia faktycznie pochodziła z Projecta. • W krótkich tekstach bywa to pomocne, w długich trochę mniej, bo nie zna toto gramatyki i czasem śmieszne podpowiedzi podsuwa. • Z moich obserwacji wynika, że MT sprawdza się głównie w krótszych sformułowaniach. • Jak dla mnie, to Machine Translation przydaje się w krótszych, kilkuwyrazowych jednostkach. • Czasem jednostki są naprawdę świetnie przetłumaczone
Oceny tłumaczy • To nie działa i nie będzie dobrze działać, bo do działania takich systemów jest niezbędna sztuczna inteligencja, której jak na razie nie udało się stworzyć. • Zwodnicze - w większości przypadków niektóre wyrazy są wyjątkowo dziwnie przetłumaczone i trudno się domyślić, dlaczego akurat tak, a nie inaczej. • Jednostki z czymś w środku (u mnie to były nawiasy klamrowe) - zupełny bełkot • Nie zna toto gramatyki i czasem śmieszne podpowiedzi podsuwa. Najgorsze, że daje złudne poczucie, że ma się sensowną podpowiedź, i może totalnie wprowadzić w błąd • W bardziej skomplikowanych przypadkach automat zwykle gubi się i nieraz powstaje zdanie bez sensu • Te tłumaczenia maszynowe to żadna pomoc - mnie one wręcz przeszkadzają • Czuję się coraz bardziej jak pracownik Biedronki
Dziękuję za uwagę Podsumowanie • Kontakt: • z.piotrowicz@moravia-polska.pl