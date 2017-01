SI „uczyła się” od roku 2010 do 2015, analizując w sumie 118 tys. wypowiedzi.

Wiele wskazuje na to, że osoby wiążące swoją karierę z umiejętnością czytania z ruchu warg mogą się w niedługim czasie gorzko rozczarować. Okazuje się, że nawet najbardziej wprawny człowiek nie może w tym zakresie równać się z nową aplikacją Google.

W ramach wspólnego projektu Google’s DeepMind i naukowców z Oksfordu powstała ucząca się sztuczna inteligencja, która swoimi umiejętnościami znacząco przewyższa nawet najbardziej sprawnych specjalistów. Aplikacja doskonaliła swoje umiejętności w oparciu o ponad 5 tys. godzin nagrań pochodzących z sześciu różnych kanałów programów BBC, włączając w to Newsnight, BBC Breakfast oraz Question Time.

SI „uczyła się” od roku 2010 do 2015, analizując w sumie 118 tys. wypowiedzi. W tym roku naukowcy postanowili przetestować umiejętności SI na nieznanych jej wcześniej programach telewizyjnych, emitowanych przez BBC od marca do września 2016 roku.

Jak donosi portal „New Scientist”, okazało się, że system jest w stanie poprawnie odcyfrować treść przekazu, jedynie „obserwując” ruch warg występującej na ekranie osoby. Co więcej, dotyczyło to nie tylko zdań prostych, ale też tych o konstrukcji złożonej.

Kolejnym krokiem naukowców było sprawdzenie, kto lepiej radzi sobie z czytaniem z ruchu warg: człowiek czy maszyna? Okazało się, że korzystając z dokładnie tego samego materiału, człowiek był w stanie odcyfrować bezbłędnie jedynie 12,4 proc. słów. Sztuczna Inteligencja poradziła sobie z tym zadaniem dużo lepiej, poprawnie odgadując aż 46,8 proc. słów.

Dodatkowo większość błędów popełnionych przez program dotyczyło małych wpadek językowych, takich jak brak końcówki „s” na końcu angielskiego wyrazu. Jak widać, w czytaniu z ruchu warg komputer nie ma sobie równych.

Po co nam SI czytająca z ruchu ust?

W jaki sposób naukowcy planują wykorzystać swój wynalazek? Jak sami twierdzą, zastosowania komercyjne są dużo szersze, niż może się wydawać na pierwszy rzut oka. Poza dość oczywistym przystosowaniem SI w programach dla osób niesłyszących program może okazać się przydatny dla każdego z nas.

W rozmowie z „New Scientist” naukowcy zasugerowali, że ich program mógłby być wykorzystany w maszynach reagujących na głos człowieka. Gdyby były one dodatkowo wyposażone w program reagujący na ruch warg korzystającej z nich osoby, ryzyko pomyłki, np. przy zamawianiu jedzenia, mogłoby być ograniczone niemal do minimum. Czy zamawiając burgera, będziemy w istocie konwersować z super-sprawną SI? Wiele wskazuje na to, że tak.