Czy dzięki Google Translate nauka języków stanie się przeżytkiem?

Pora na translatora
Automatyczne tłumaczenia podbiły sieć, a za sprawą Google Translate zaczynają wychodzić na ulice. Czy nauka języków stanie się przeżytkiem?
Hiszpański, francuski, portugalski, niemiecki, japoński, chiński, koreański i turecki – tłumaczenie tych ośmiu języków na angielski i z powrotem Google powierzyło rok temu sztucznej inteligencji.
Mirosław Gryń/Polityka

Hiszpański, francuski, portugalski, niemiecki, japoński, chiński, koreański i turecki – tłumaczenie tych ośmiu języków na angielski i z powrotem Google powierzyło rok temu sztucznej inteligencji.

Wszystkie 103 języki dostępne w Translate mają być obsługiwane przez sztuczną inteligencję na początku nowego roku. Język polski otrzymał asystę sztucznej inteligencji już w marcu 2017 r.
Mirosław Gryń/Polityka

Wszystkie 103 języki dostępne w Translate mają być obsługiwane przez sztuczną inteligencję na początku nowego roku. Język polski otrzymał asystę sztucznej inteligencji już w marcu 2017 r.

Lingwistyczne algorytmy coraz częściej samodzielnie szukają materiałów do nauki, przyglądając się chociażby ludzkim konwersacjom w sieci.
Mirosław Gryń/Polityka

Lingwistyczne algorytmy coraz częściej samodzielnie szukają materiałów do nauki, przyglądając się chociażby ludzkim konwersacjom w sieci.

Programista popełnił głupi błąd. Polecono mu połączyć kilka języków używanych w Indiach w jeden model językowy systemu Google Translate, najpopularniejszego internetowego tłumacza. Serwis ten obsługuje obecnie 103 języki – od afrikaans i albańskiego po xhosa i zulu – z których korzysta 99 proc. internautów. Zgrupowanie kilku pokrewnych języków indyjskich we wspólny model miało sprawić, że maszyna będzie uzupełniać braki w jednym języku na podstawie jego podobieństw do pozostałych. Mniej więcej tak jak osoba znająca język hiszpański łatwiej radzi sobie z nauką portugalskiego. A znająca litewski – z łotewskim.

Programista miał więc wrzucić do jednego modelu dziewięć języków używanych w Indiach, które obsługuje obecnie Translate, czyli: hindi, bengalski, telugu, marathi, tamilski, urdu, gudżarati, malajam oraz kannada. Pomylił się jednak, wpisując skrótową nazwę tego ostatniego. Zamiast „KN” oznaczającego kannada wstawił „KA” oznaczające gruziński. – Zgłupieliśmy. Bo zgłupieć powinien był nasz model indyjski po wpuszczeniu do niego języka gruzińskiego. A zamiast tego skokowo poprawił jakość swoich tłumaczeń – wspomina Barak Turovsky, szef projektu Google Translate.

To wtedy jego zespół po raz pierwszy postawił hipotezę, że może istnieje coś większego niż grupy językowe – słowiańska, romańska, germańska itd. Faktyczna interlingua, system obejmujący większość lub wszystkie języki świata. W drodze kontrolowanych już eksperymentów potwierdzili, że nawet najodleglejsze geograficznie i kulturowo języki mogą wspierać się wzajemnie w automatycznych tłumaczeniach. – W rezultacie język polski funkcjonuje obecnie we wspólnym modelu z wietnamskim i tajskim – śmieje się Turovsky.

Magia gramatyki

Geneza łączenia języków we wspólne modele była jednak bardzo prozaiczna. Chodziło o oszczędzanie mocy procesorów. Stało się to niezbędne, gdy Translate rok temu zaczęło przełączać swój system na sztuczną inteligencję. – Za jednym kliknięciem osiągnęliśmy większy postęp w tłumaczeniach niż przez dziesięć lat wcześniejszej pracy – wspomina Turovsky. – Ale nadwerężyliśmy też procesory naszej firmy, mimo że są przecież potężne. Model oparty na sztucznej inteligencji był 100 razy wolniejszy od dotychczasowego.

Historię tłumaczenia maszynowego Turovsky streszcza w trzech erach. Pierwszą były tłumaczenia z okresu zimnej wojny, gdy Amerykanie chcieli mieć szybki wgląd w dokumenty rosyjskie czy chińskie. Karmili swoje systemy bazą słów i zasadami gramatyki danych języków. A następnie instruowali je, jak przełożyć teorię na praktykę. Wymagało to jednak stałej asysty lingwistów, zarówno na początku procesu – musieli przygotować i przełożyć na język programowania bazę wiedzy o obu językach – jak i podczas interpretacji otrzymanych wyników.

Druga generacja tłumaczeń rozwinęła się na dobre dopiero na początku obecnego wieku. Jej symbolem stało się właśnie Translate. Chodziło o porównywanie tych samych tekstów zapisanych w różnych językach w poszukiwaniu statystycznych prawidłowości. Dlatego zespół Translate tak bardzo chwalił sobie dokumenty ONZ, zawsze tłumaczone przynajmniej na sześć oficjalnych języków. A jeszcze bardziej „Harry’ego Pottera”. Bo książki z tej serii wydano w ponad 70 językach. Maszyna nie musiała rozumieć słów ani znać gramatyki danego języka. Wystarczyło, że wiedziała, jak są stosowane. A tego uczyła się poprzez porównywanie przekładów dokonanych ludzką ręką.

Podejście to miało jednak dwie zasadnicze wady. Po pierwsze, maszyna mogła być tylko tak dobra jak dostępne materiały. A ilość i jakość dokumentów była satysfakcjonująca tylko dla garści najbardziej rozpowszechnionych języków. – Angielski, hiszpański, francuski czy nawet japoński nie sprawiały problemów. Ale co z arabskim? Chociaż po arabsku mówi 300400 mln ludzi na całym świecie, dobre tłumaczenia dostępne w internecie to rzadkość – mówi Turovsky. A co z amarskim czy zulu? Drugą wadą tłumaczeń drugiej generacji było to, że musiały rozbijać zdania na mniejsze fragmenty o długości maksymalnie pięciu słów. Analizowały je następnie w oderwaniu od kontekstu. – Translate mogło w dwie sekundy przetłumaczyć akapit, który mu zadałeś. Ale potem potrzebowałeś dwóch minut, by zrozumieć sens otrzymanego przekładu – śmieje się Turovsky.

Potrzebny był system, który patrzy na całość zdania, akapitu, a najlepiej całego dokumentu. I będzie wiedział, czy słowo „parować” dotyczy w danym przypadku wody, czy może dobierania w pary, a „marynarka” – garderoby czy armii. I takie wyzwanie postawili sobie programiści, inaugurując trzecią erę tłumaczeń.

Czytaj także

Trendy, komentarze

W nowej POLITYCE

Zobacz pełny spis treści »

Poleć stronę

Zamknij
Facebook Twitter Google+ Wykop Poleć Skomentuj

Ta strona do poprawnego działania wymaga włączenia mechanizmu "ciasteczek" w przeglądarce.

Powrót na stronę główną