Wiele wskazuje na to, że osoby wiążące swoją karierę z umiejętnością czytania z ruchu warg mogą się w niedługim czasie gorzko rozczarować. Okazuje się, że nawet najbardziej wprawny człowiek nie może w tym zakresie równać się z nową aplikacją Google.
W ramach wspólnego projektu Google’s DeepMind i naukowców z Oksfordu powstała ucząca się sztuczna inteligencja, która swoimi umiejętnościami znacząco przewyższa nawet najbardziej sprawnych specjalistów. Aplikacja doskonaliła swoje umiejętności w oparciu o ponad 5 tys. godzin nagrań pochodzących z sześciu różnych kanałów programów BBC, włączając w to Newsnight, BBC Breakfast oraz Question Time.
SI „uczyła się” od roku 2010 do 2015, analizując w sumie 118 tys. wypowiedzi. W tym roku naukowcy postanowili przetestować umiejętności SI na nieznanych jej wcześniej programach telewizyjnych, emitowanych przez BBC od marca do września 2016 roku.
Jak donosi portal „New Scientist”, okazało się, że system jest w stanie poprawnie odcyfrować treść przekazu, jedynie „obserwując” ruch warg występującej na ekranie osoby. Co więcej, dotyczyło to nie tylko zdań prostych, ale też tych o konstrukcji złożonej.
Kolejnym krokiem naukowców było sprawdzenie, kto lepiej radzi sobie z czytaniem z ruchu warg: człowiek czy maszyna? Okazało się, że korzystając z dokładnie tego samego materiału, człowiek był w stanie odcyfrować bezbłędnie jedynie 12,4 proc. słów. Sztuczna Inteligencja poradziła sobie z tym zadaniem dużo lepiej, poprawnie odgadując aż 46,8 proc. słów.
Dodatkowo większość błędów popełnionych przez program dotyczyło małych wpadek językowych, takich jak brak końcówki „s” na końcu angielskiego wyrazu. Jak widać, w czytaniu z ruchu warg komputer nie ma sobie równych.