O tłumaczeniu automatycznym słów kilka

Computers are missing the breadth of knowledge that humans have access to. Artificial language processing remains 10 years away, just as it has for the last few decades.

Niemalże każdego dnia jesteśmy bombardowani wspaniałymi wiadomościami o nowych, cudownych programach tłumaczeniowych, które straszą/obiecują (w zależności od odbiorcy njusa z dupy), że zastąpią żywych, ludzkich tłumaczy, więc my, tłumacze, wylądujemy na bruku i zgnijemy w rynsztoku z niemodnym słownikiem w ręku, dupiu, cudzysłowiu. Bo komputery to przyszłość. Bo sztuczna inteligencja jest coraz lepsza, a jej kosmiczne algorytmy wyręczą człowieka w tak przyziemnej kwestii jak nauka języka. Learning who? In my 2022? Unheard of, I don’t know her!

Gdy co jakiś czas publikuję na moich insta stories przykłady fatalnego automatycznego tłumaczenia oraz mówię, dlaczego elektroniczne translatory nie mogą poprawnie tłumaczyć, zawsze znajdzie się kilka osób o zerowej wiedzy nie tylko z translatoryki, ale i z podstaw przyswajania języka (nie mówiąc już o teorii znaku czy kodowaniu i dekodowaniu języka), które całe w pąsach i pretensjach zarzucają mi ignorancję, że w XXI wieku nie wierzę w cudowności techniki na tym polu. Na nic moje kierunkowe studia, zagraniczne stypendium, międzynarodowe certyfikaty oraz piętnastoletnie doświadczenie w zawodzie tłumacza i nauczyciela! Bo przecież jak ja mogę nie wierzyć w świetlaną przyszłość translatorów guglorów, skoro technika idzie do przodu?! Dlaczego nie wierzę komuś, kto nie jest profesjonalnym tłumaczem i nie wie nawet, jak funkcjonuje język? No jakiś taki bezczelny i niepokorny chyba jestem?!

Wierzyć sobie można w bajki lub religię, co kto woli, a mnie interesują fakty. I pewnie, technika generalnie do przodu idzie, ale niektóre dziedziny życia są właściwe tylko ludziom. Bo posiadamy korę nową (neocortex dla zainteresowanych tym, czy faktycznie nasze ciało zbudowane jest z czerwonych żelków). W telegraficznym skrócie, oczywizda, bo nie da się w jednym wpisie zawrzeć tego, co ludzie studiują i wypracowują latami (tu autor niniejszego tekstu poklepał się po ramieniu). Myślenie życzeniowe podsycane filmami sajfaj nic tu nie zmieni.

Bo gdyż ponieważ język to nie tylko słowa. Język to przede wszystkim kontekst i zatopione w nim emocje oraz intencje; to, co pomiędzy słowami, na kartach historii i w kulturze życia codziennego. Język to narzędzie do przekazywania doświadczenia i nabywania wiedzy. Czym jest zatem tłumaczenie? Chuj wi, bo z definicją nadal problem, ale przyjmuje się, że odbywa się przez lub za pomocą tak zwanego tertium comparationis, co z łaciny oznacza “trzecie do porównania”. Tłumaczenie jako proces to ścieranie się płaszczyzn różnych języków na styku opisywanych przez nie rzeczywistości, które wymagają odzwierciedlenia za pomocą innych środków. Tłumaczenie jako produkt tego procesu to wycinek rzeczywistości ukuty na nowo za pomocą narzędzi dostępnych w danym języku. To trochę jak z kolorami: mój zielony nie jest Waszym zielonym, i vice versa, i vis-à-vis, i foie gras. A poza tym kolory są umowne. Kolor to fala, którą mózg odbiera, interpretuje i dekoduje w dany sposób za pomocą organicznych narzędzi, którymi dysponuje – i ze wszystkimi ich ograniczeniami. Wszystko, co przyjmuje dany kształt, przyjmuje też ograniczenia z tego kształtu wynikające (dlatego np. lęk rozlany jest tak niebezpieczny, ale nie o tym, nie o tym!). Tak więc to, co większość z nas odbiera jako zielone, zielone w rzeczywistości wcale być nie musi. I owszem, rację ma ten, kto teraz pomyślał, że przecież dwa różne języki nigdy nie oddadzą tego samego w ten sam sposób. Hiperbola i spłaszczenie. Wybór należy do ciebie, tłumaczu, choć zależny jest od… uwaga, za moment padnie słowo-klucz… kontekstu.

Odkąd zacząłem parać się tłumaczeniami jeszcze na zajęciach podczas studiów, gdy tylko usłyszę o „przełomie” w programowaniu języka czy „szybko uczących się sieciach neuronowych”, przeprowadzam szybkie testy danego oprogramowania, stosując kilka nieskomplikowanych zdań. Do tej pory te wszystkie super hiper mega yntelygentne programy nie są w stanie poradzić sobie z prostymi konstrukcjami nawet na poziomie podstawowym. Shocker, I know! Dlaczego? Bo nie mogą. Fizycznie to niemożliwe. Te wszystkie piękne słowa i pseudo-neuro-terminy nic nie znaczą, bo automatyczne tłumaczenie polega na wyszukiwaniu kluczowych słów jak rzeczowniki i oddawaniu ich najbardziej prawdopodobnego sensu. Wszystko fajnie, no tylko nie tak działa język. Ludzki język, warto dodać. Takie programy w gruncie rzeczy funkcjonują jak papierowe słowniki, tłumacząc słowo po słowie, totalnie pomijając głębsze warstwy języka, jak kulturowo-historyczne konotacje (skojarzenia). Nie będę już nawet wspominał o slangu, rejestrze i bogactwie figur stylistycznych oraz retorycznych, które dla maszyny są tylko nic nieznaczącym ciągiem części mowy. Ba, nawet nie części zdania, bo one wymagają już innego – zgadza się, ludzkiego – spojrzenia na strukturę zdania i wypowiedzi. Mówisz, że honest i frank to “szczery”? Historic i historical to “historyczny”? Economic i economical to “ekonomiczny”? Moist i humid to “wilgotny”? Can i may to “móc”? Trip i journey to “wycieczka”? To powodzenia. Dużo. Bo gdzie brak wiedzy, tam na szczęście trzeba liczyć. Należałoby jeszcze wspomnieć o rodzajach ekwiwalencji i problemach z nią związanych oraz o wszystkich dostępnych tłumaczeniowi narzędziach, które stanowią pewien koncept i zależą od tego, co się tłumaczy, dla kogo i w jakim celu, ale żeby to wszystko miało sens, musi paść na podatny grunt. Ludzki mózg. I naprawdę nie ma znaczenia, że komputer może prowadzić obliczenia szybciej niż człowiek. Nie o ilość chodzi, a o jakość, bo kontekst to więcej niż suma jego części, jak i człowiek to więcej niż suma jego organów.

Tak, wiem. Często odnoszę się do kontekstu, ale to z uwagi na jego rolę; nie tylko w tłumaczeniu, ale i uczeniu się i nauczaniu. Znajomość kontekstu to podstawa. Plus, to chyba oczywiste, znajomość specyfiki języków, w ramach których tłumaczymy. Języki podatne są na różne błędy oraz mają mocne i słabe strony (lepiej lub gorzej mogą wyrażać czy opisywać pewne aspekty rzeczywistości w porównaniu z innymi), co wynika z ich cech i narzędzi, którymi dysponują. W języku angielskim szalenie istotny i widoczny jest np. aspekt określoności i policzalności rzeczownika oraz pozycji słówek w zdaniu (od której zależy ich funkcja). Z kolei w polskim kolejność słówek jest dużo bardziej swobodna, bo o ich funkcji oraz relacjach między elementami w zdaniu mówi fleksja (ich końcówki). W angielskim istnieje też ponad dwukrotnie więcej dźwięków samogłoskowych niż w polskim, a i akcent wyrazowy, choć tzw. swobodny, musi paść na konkretną sylabę, bo inaczej często zmienimy znaczenie słówka, akcentując inną sylabę. Jeśli pierwszy raz się z tym stykacie, to zachęcam do przerwania błędnego koła wiecznego poziomu średnio zaawansowanego i nadrobienia zaległości z tekstami Angielska fonetyka: zarys dźwięków oraz Angielska fonetyka: akcent wyrazowy. Serio trzeba. Braki w wymowie szybko się mszczą w językach niefonetycznych, a takim jest język angielski właśnie.

Wracając do tematu i odpowiedzi na pytanie, dlaczego tłumaczenie słowo w słowo to kupa, która daje gówniane efekty. Proponuję prosty eksperyment na poziomie A1. Jak przetłumaczymy zdanie “rozmawiamy teraz”? Powiemy We’re talking. A jak przetłumaczymy w drugą stronę I’m listening? Na “Słucham”. Co tu się podziało? Na pierwszy rzut oka, w zależności od kierunku tłumaczenia, zniknął lub pojawił się zaimek osobowy w funkcji podmiotu. W angielskim musi być, a w polskim nie, bo odmiana czasownika mówi nam, z jakim podmiotem mamy do czynienia. Tyle tylko że tłumaczenie tych prostych zdań w dowolnym kierunku to tylko konwencja narzucona przez to, co akceptowalne, wymuszone i oczekiwane przez ramy drugiego języka. Bo w rzeczywistości bardziej dosłownie I’m listening to…  “Jestem słuchający”. Z kolei We’re talking to “Jesteśmy rozmawiający”. Dlaczego? Bo o ile “rozmawiamy” i “słucham” to czasowniki, o tyle talkinglistening to imiesłowy, czyli… przymiotniki odczasownikowe. Co z tego wynika? Że te słówka nie pełnią roli czasowników, a przynajmniej nie w angielskim. Są na pozycji przymiotnika i można pod nie podstawić prawdziwe przymiotniki, jak English czy nice. Działa to w obie strony bez względu na kierunek tłumaczenia. Mówimy więc We’re talking oraz “Słucham”, bo taka jest konwencja języka docelowego (tu: polskiego); takie są jego ramy, w które upychamy interesujący nas przekładem wycinek rzeczywistości. A przecież mnóstwo jest rzeczy nieprzetłumaczalnych, które można jedynie sparafrazować, często niestety gubiąc wydźwięk oryginału. Jeśli ktoś nie wierzy, nie rozumie, o czym pisze, albo nadal myśli, że czasów w angielskim jest między 12 a 16, sugeruję zapoznać się z wpisem pt. Ile czasów liczy angielski?. Najwyższa pora przestać wierzyć w mity i zacząć myśleć samodzielnie, ale by myśleć krytycznie, trzeba mieć ku temu podstawy tak praktyczne, jak i teoretyczne.

Wspomnianych przez mnie testów przez lata robiłem setki, jeśli nie tysiące (plus dwustustronicowa praca magisterska poświęcona błędom w przekładzie), więc podzielić się z Wami mogę tylko garstką pojedynczych zdań (dłuższych fragmentów nie będę wklejał, bo są jeszcze gorzej tłumaczone). Z lewej strony jest zdanie oryginalne, a z prawej, po strzałce, automatyczne tłumaczenie często podawane z (równie kretyńskimi) alternatywami. W nawiasie pokrótce opiszę też problem z tłumaczeniem, ale nie będę wdawał się w szczegóły. W przypadku niektórych zdań prawidłowa wersja padła, ale tylko jako alternatywa któraś z kolei, co jest niedopuszczalne, bo tłumaczenie to nie zgadywanka.

  • and whatnot -> i co nie / a co nie / i co z tego/ a co tam
    (to w ogóle nie to, a w sumie prosta sprawa, bo chodzi raptem o jedno słówko)
  • at the parent’s -> u rodziców
    (to nie ten dopełniacz)
  • u rodziców -> at the parents / in parents / in the parents
    (dopełniacza w ogóle brak)
  • Jestem w barze. -> I’m in a bar. / I’m in the bar.
    (problem z nierozróżnianiem przyimków in oraz at, o przedimku nie wspomnę)
  • I’m in a restaurant. / I’m at a restaurant. -> Jestem w restauracji
    (to samo, co wcześniej, ale w drugą stronę)
  • The John Smith was looking for you. / A John Smith was looking for you. -> John Smith cię szukał.
    (totalne pominięcie przedimków, co zmienia znaczenie zdań).
  • It’s lopsided. -> To jest przegięte/przegięcie/nieporozumienie.
    (to w ogóle nie to słówko)
  • Nie interesuj się. -> Take no interest / Don’t be interested / Don’t take an interest.
    (niby gramatycznie poprawne, tylko że tak się nie mówi)
  • He’s working you like a donkey. -> Pracuje z tobą jak osioł. / Pracuje na ciebie jak osioł.
    (takie coś w polskim nie funkcjonuje)
  • You fell for it! -> Zakochałeś się w tym!
    (problem wieloznaczności czasowników frazowych)
  • Robi cię w konia. -> Makes you a horse.
    (nie tylko takie coś w angielskim nie funkcjonuje, to jeszcze jest niepoprawne gramatycznie)
  • He’s very particular about… -> Jest bardzo szczególny/szczegółowy w stosunku do…
    (znowu nie to słówko)
  • I hope he helps us. / I hope he will help us. -> Mam nadzieję, że nam pomoże.
    (tłumaczenie praktycznie zawsze pomija czasownik modalny will, co zmienia znaczenie)
  • Ważne, byś tu był. -> It’s important you are here.
    (niewłaściwa forma czasownika, która niesie inne znaczenie)
  • It’s important you not be late. -> Ważne, żeby się nie spóźnić.
    (dziwaczna i nieuzasadniona zmiana osoby)
  • Is that a mould? -> Czy to pleśń?
    (nie ten rzeczownik)
  • He was locked in. -> Był zamknięty w sobie.
    (nie ten czasownik)
  • When I arrived, they went home. / When I arrived, they’d gone home. -> Kiedy przyjechałem, poszli do domu.
    (kompletne nierozróżnienie aspektu Simple i Perfect, co zmienia znaczenie całego zdania)
  • Idź już. -> Go figure.
    (to tak idiotyczne, że nie wiem, co powiedzieć)

Totalnie pomijam zdania nieco bardziej złożone (z kilkoma rzeczownikami, dopełnieniami czy okolicznikami), choć nadal proste, np. “Idę jutro do kina z Markiem” czy “Do kina z Markiem idę jutro”, czy “Do kina z Markiem jutro idę” oraz angielskie zdania tego typu, bo tylko człowiek jest w stanie zrozumieć różnice płynące zarówno z bardziej abstrakcyjnych elementów, jak i z ich umiejscowienia w zdaniu.

Słyszeliście o teście Turinga? Jeśli tak, warto zapoznać się ze schematami Winograda. Jeśli nie, to też warto się z nimi zapoznać. Bo czemu nie!

Nie wystarczy znać język, by móc tłumaczyć, jak i nie wystarczy mieć 10 palców, by być profesjonalnym pianistą. To tylko podstawowy wymóg. By móc nazywać się profesjonalistą, potrzebna jest wiedza i doświadczenie, a te zdobywa się z czasem, poświęceniem i cierpliwością. I nie, nie twierdzę, że zbudowanie maszyny mającej szansę tłumaczyć tak dobrze, jak człowiek, jest niemożliwe. Tyle tylko że wiem, czego by to wymagało: stworzenie struktury, która w sposób doskonały imitowałaby ludzki mózg wraz z całą wiedzą i pełnym doświadczeniem plus umiejętnością uczenia się i tworzenia nowych połączeń neuronowych, by łączyć nowe doświadczenia z poprzednimi.

Tak więc można piszczeć i tupać nóżkami, w zachwycie rozpływając się and filmami sajfaj, ale fakty pozostają niezmienne: programy tłumaczeniowe tworzą leniwi monolingwiści dla naiwnych monolingwistów. Dlatego kto nie inwestuje we własny rozwój i własne doświadczenie, będzie płacił za cudze.

2 comments to “O tłumaczeniu automatycznym słów kilka”
  1. Translatorom do człowieka brakuje bardzo dużo, ale trochę spłycasz w jaki sposób te narzędzia obecnie działają. Sieci neuronowe nie tłumaczą słowo po słowie ze słownika, tylko uczą się z danych, to jest z tekstu: np. dostają książki w języku A oraz te same książki przetłumaczone na język B, i szukają zależności pomiędzy nimi, w sposób trochę głębszy niż patrzenie na pojedyńcze słówka. To co istnieje obecnie ma szansę czasami dobrać adekwatne idiomy w języku docelowym, nawet w jakimś stopniu dopasować styl i ton. Do skuteczności człowieka daleko, ale nie działa to aż tak prymitywnie jak napisałeś 🙂
    Inna sprawa, że narzędzia komercyjne są raczej trochę do tyłu w porównaniu z tym, co opracowują naukowcy.

    • Upraszczam, bo nie da się zawrzeć studiów językowych i psychologicznych w jednym tekście. „Czasem” to baaardzo kiepski wynik, niedopuszczalny podczas tłumaczenia organicznego.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *