Artykuł w wersji audio
Wyłącz budzik. Włącz światło. Jaka dziś pogoda? O której i gdzie mam spotkanie? Znajdź dobrą restaurację w tamtej okolicy. Zarezerwuj stolik. Nawiguj do celu. Pokaż korki. Poszukaj stacji benzynowej. Znajdź parking. Wycisz powiadomienia. Wyślij SMS. Włącz ogrzewanie. Zagraj coś jazzowego. Co to za utwór? Zadzwoń do mamy. Włącz mi „Star Treka” tu, gdzie ostatnio przerwałem. Wyłącz film. Ustaw budzik na siódmą. Dobranoc.
Akurat miłośników serii „Star Trek” nie zdziwi lista komend, które rozumie i realizuje nowy gadżet o nazwie Google Home. Pasażerowie statku Enterprise w każdej chwili mogli przecież spytać komputer o cokolwiek i natychmiast otrzymać pomoc. Podobnie nabywcy niepozornego głośnika w kształcie ni to cylindra, ni to małej wazy na kwiatki. Pod wdzięczną obudową kryje się komputer podłączony jednocześnie do internetu i naszego domu. Pozwala wyszukiwać informacje w sieci na wzór tradycyjnych wyszukiwarek. Ale na wiele pytań odpowiada od razu. Jaka jest odległość Księżyca od Ziemi? Pogodny kobiecy głos odpowiada bez wahania: 384 400 km. Równie szybko recytuje wynik dzielenia 134 200 przez 34 z dokładnością do ósmej liczby po przecinku. Ile kalorii ma jabłko? 51,4. Kiedy powstała Polska? Polskę założono 14 kwietnia 966 roku. Kto Polską rządzi? Andrzej Duda.
Jeśli mu na to pozwolimy, urządzenie chętnie przejmie także sterowanie domową elektroniką i uwolni nas od takich czynności, jak zapalanie i gaszenie świateł, regulowanie mocy ogrzewania, a nawet obsługa ekspresu do kawy. O wiele rzeczy nie będziemy musieli nawet pytać czy prosić. Na podstawie obserwacji codziennego życia domowników nauczy się ich nawyków. Nastawi budzik, a rano ostrzeże, że czas wychodzić do pracy – inaczej się spóźnisz. Jeśli tak go zaprogramujesz, na hasło „Spóźnię się” sam wyśle na skrzynkę pracodawcy wcześniej maila z przeprosinami. Znajdzie informacje o czekającej nas podróży i w odpowiednim czasie zapyta, czy ma zamówić taksówkę.
Od wcale nie mniej inteligentnych laptopów i smartfonów urządzenie to odróżnia jednak nie to, w jakich sprawach się z nim komunikujemy, ale w jaki sposób.
OK Computer
„Wczoraj wieczorem chciałem zrobić sobie krótką przerwę od pisania. Poszedłem więc do drugiego pokoju i poprosiłem o włączenie muzyki. Rozciągałem się przez kilka minut. Wychodząc, kazałem wyłączyć muzykę. Wszystko bez najmniejszego trudu. Nie musiałem odblokowywać ekranu telefonu, uruchamiać aplikacji, szukać piosenki i wskazywać, który zestaw głośników ma ją zagrać. Wypowiedziałem po prostu parę słów i wszystko samo się wydarzyło” – zachwycał się jeden z recenzentów Google Home.
Podobnie jak Amazon Echo, starszy o dwa lata konkurent Google Home, inteligentny głośnik nie ma ekranu ani klawiatury. Jedynie parę podstawowych przycisków, jak głośność (bo przy ustawionej na maksymalną mógłby nie usłyszeć naszych próśb o ściszenie). Polecenia zasadniczo przyjmuje wyłącznie w formie werbalnej. Wystarczy wypowiedzieć słowo klucz, które wybudza urządzenie ze snu – w przypadku Home jest to „OK Google” – i wypowiedzieć życzenie. Dlatego w swoich reklamówkach Google pokazuje sytuacje, w których brakuje nam rąk. Wchodzisz do domu ze śpiącym dzieckiem w ramionach? „OK Google. Włącz światło”. Urabiasz ciasto i zapomniałeś, ile cukru należy dodać, ale dłonie masz całe w mące? „OK Google. Przeczytaj mi przepis jeszcze raz”. Wnosisz tort niespodziankę? „OK Google. Zgaś światło. Zagraj »Happy Birthday«”. I wcale nie trzeba podnosić głosu czy mówić wyraźniej niż do znajomych – czego wymagały dotąd smartfony i smartwatche, a nawet superkomputer ze statku Enterprise.
Ale to właśnie filmom science fiction zawdzięczamy fakt, że futurystyczne, cokolwiek niepokojące urządzenia – wszak nieustannie nas podsłuchują! – tak szybko się rozpowszechniają. Szacuje się, że do końca 2017 r. już w kilkudziesięciu milionach domów na świecie będzie stał inteligentny cylindryczny głośnik. Ich pojętność mało kogo dziwi, bo Hollywood przez pół wieku przygotowywało nas na moment, gdy ze sztuczną inteligencją będziemy rozmawiać jak z inteligencją naturalną. Począwszy od „Star Treka” i „2001: Odysei kosmicznej”, przez „Raport mniejszości”, po najnowsze hity serialowe: „The Expanse” czy „Westworld”. Nikt w kinie nie musi tłumaczyć, na czym polega sterowanie pojazdem czy komputerem przy pomocy głosu. Hollywood słusznie zakłada, że każdy widz doskonale to zrozumie. „Często przywołujemy przykład komputera pokładowego Enterprise, aby wytłumaczyć, nad czym pracujemy – mówił jeden z dyrektorów Google. – Ale to więcej niż metafora. To ideał, do którego dążymy”.
Dla pokolenia wychowanego na takich wizjach mówienie i słuchanie – zamiast pisania i czytania – w komunikacji z komputerem staje się więc już nie nowinką, lecz czymś oczekiwanym. Ponad połowie amerykańskich nastolatków zdarza się wydawać smartfonowi polecenia głosem. To, co zdumiewa, a nawet przeraża ich rodziców, dla nich jest codziennym standardem. Jak zauważa technologiczny serwis Hackaday, współczesne urządzenia rozumieją nas tak dobrze, że można zupełnie zrezygnować z używania klawiatury – chyba że chcemy zachować prywatność. Przy obecnym tempie rozwoju precyzja komputerów w ciągu 2–3 lat dogoni możliwości percepcyjne człowieka. „I wtedy wydarzy się coś magicznego” – obiecuje Xuedong Huang, ekspert Microsoftu w dziedzinie transkrypcji audio. Według niego 10 lat temu poziom błędów w automatycznej transkrypcji sięgał 80 proc. Teraz zbliża się do 8 proc. „Gdy dokładność wzrośnie o kolejne kilka punktów procentowych, zamiast urządzeń kontrolowanych głosem prawie nie używać, będziemy ich używać bez przerwy” – przekonuje na łamach „The Economist” szef rozwoju Baidu, chińskiego odpowiednika Google.
Tygodnik przytacza badania marketingowe, według których dzieci wychowujące się pod okiem (uchem?) domowych asystentów traktują urządzenia niemal jak kolejnego członka rodziny. Pewne wytłumaczenie przynoszą obserwacje naukowców z Uniwersytetu Stanforda. Przeprowadzili oni serię eksperymentów w poszukiwaniu odpowiedzi, jakim głosem roboty powinny mówić: możliwie naturalnym czy nieco mechanicznym. Dorośli nie wykazywali specjalnych preferencji, a nastolatki tylko odrobinę wolały ton ludzki. Ale dzieci zdecydowanie chętniej rozmawiały i znacznie więcej zapamiętywały, kiedy ich cyfrowy partner wypowiadał się tembrem naturalnym. A takim właśnie mówią do nas Google Home i Amazon Echo. Pytanie, czy mówią prawdę, a raczej – czyją?
Mój przyjaciel gadżet
Co nietypowe dla technologicznych nowinek, aby poczuć się we własnym domu jak kapitan Kirk na mostku Enterprise, wcale nie trzeba wydawać wielkich pieniędzy. Cena tych gadżetów nie przekracza 200 dol. Okazyjnie spada do połowy tej kwoty. Rośnie za to konkurencja. Własne urządzenie szykuje Apple, które już od pięciu lat wyposaża swojego iPhone’a w wirtualnego asystenta o nazwie Siri. Do wyścigu wkrótce dołączy Samsung i kilka koncernów chińskich. Niemal wszystkie większe korporacje IT oraz tuziny start-upów ścigają się o pierwszeństwo w rozwoju interfejsu głosowego. Aby ich asystent był mądrzejszy, bardziej elastyczny i pomocny od wszystkich pozostałych. „Bo wierzą, że wkrótce będziemy rozmawiać ze swoimi gadżetami jak z przyjaciółmi – pisze magazyn „Wired”. – A po każdej takiej przyjacielskiej pogawędce nasza relacja z technologią będzie bardziej osobista, lojalna, wręcz intymna”.
Zakres kompetencji urządzeń Google czy Amazona już teraz wykracza daleko poza mechaniczne wykonywanie poleceń. Jeśli się nudzisz, Home opowie ci żart albo znajdzie w sieci jakąś ciekawostkę. Przed wakacyjnym wypadem poleci najciekawsze zabytki czy knajpy do odwiedzenia. Przetłumaczy też – na żywo! – rozmowę z gościem z zagranicy. Przez cały tydzień będzie dopisywać kolejne produkty do listy zakupów, którą podsunie we właściwym czasie. Echo Amazona chętnie te zakupy zrealizuje, oczywiście w sklepie internetowym swojego producenta. „Ale moją ulubioną funkcją pozostaje ta związana z muzyką – pisał jeden z recenzentów. – Gdy proszę o zagranie jakiejś piosenki, często mylę tytuł albo zamiast niego recytuję fragment refrenu. Żaden problem! I tak po chwili słyszę to, o co mi chodziło. To fenomenalne! Właśnie o taką inteligentną interakcję z komputerem zawsze nam chodziło. I trudno się nie zachwycać, gdy to się rzeczywiście dzieje”. Cytowanego zapewne ucieszy wiadomość, że wkrótce zamiast przytaczać słowa piosenki, będzie można po prostu zanucić jej fragment.
Inteligencji obecnych systemów nie należy jednak przeceniać. Ktoś postawił obok siebie urządzenia Google i Amazona i tak je zaprogramował, że zapętliły się w bezsensownej rozmowie z samymi sobą – na przemian wywołując się słowami kluczami. Inny użytkownik skarżył się na swoje pierwsze spotkanie z Google Home. Po podłączeniu polecił urządzeniu puścić na ekranie telewizora filmik instruktażowy na własny temat. Ilekroć z głośników padała fraza „OK Google”, urządzenie oczywiście budziło się do życia i realizowało polecenia, które padały w filmie.
Nie ma wątpliwości, że reklamodawcy chętnie przemycą takie komendy głosowe do programów telewizyjnych czy piosenek. „I na przykład skrycie dodadzą swój produkt do twojej listy zakupów. Albo przejrzą historię twoich wyszukiwań” – ostrzegał serwis Android Police. Dlatego cyfrowych doradców pilnie należałoby wyposażyć w zdolność rozpoznawania głosu właściciela i słuchanie wyłącznie jego poleceń. Tym bardziej że będą towarzyszyć nam przez cały dzień. Wychodząc z domu, inteligentny głośnik zostawimy wprawdzie w salonie, ale obsługującego go doradcę zabierzemy ze sobą w telefonie, w samochodzie przywita nas poprzez komputer pokładowy, a przy joggingu puści nam ulubione piosenki za pośrednictwem inteligentnych bezprzewodowych słuchawek. Wszystkie te urządzenia zsynchronizują się z naszą wirtualną tożsamością i będą wyczekiwać poleceń. Własne instrukcje chętnie podsunęliby im nie tylko reklamodawcy, ale także hakerzy. O ile ci pierwsi chętnie przejmą kontrolę nad naszym portfelem, ci drudzy – poniekąd życiem.
Dobro z automatu
Google i Amazon promują swoje urządzenia jako wybawienie dla zwykłych konsumentów. Z komunikacji bezdotykowej najbardziej skorzystają jednak szpitale i inne przestrzenie wrażliwe na higienę. A także hotele, które zechcą błysnąć nowoczesnością i odciążyć recepcjonistów. Komunikatory podobne do tych ze „Star Treka” ponad 10 lat temu zaczęła też testować amerykańska armia. Słuchające ze zrozumieniem komputery to cudowna wiadomość dla osób niewidomych czy starszych.
„Mówiące automaty już teraz służą nam jako zabawki, pomoce edukacyjne, asystują w badaniach. Wkrótce zaczną towarzyszyć nam w życiu prywatnym, w pracy, w wojsku. W rezultacie ich znaczenie społeczne znacznie przekroczy zwykły zakres wykonywanych zadań” – przekonuje Judith Markowitz z Uniwersytetu Maryland, redaktorka wydanej niedawno książki „Robots that Talk and Listen” („Roboty, które mówią i słyszą”). Według niej w najbliższym czasie czeka nas zmierzenie się z dwoma wyzwaniami: kwestią akceptacji tak zaawansowanych robotów i stworzeniem dla nich moralnych bezpieczników. Bo na razie producenci pierwszych domowych asystentów wydają się – wbrew pozorom – ostrożnie dawkować ich umiejętności. Google Home w dniu premiery ogłosił kompatybilność z zaledwie kilkoma zewnętrznymi serwisami muzycznymi czy producentami oświetlenia. Kolejne będą dodawane stopniowo. Inaczej zamiast zachwytu być może wystraszylibyśmy się wszechwiedzy, wszechmocy i wszechobecności asystentów.
„Niegdyś musieliśmy podejść do komputera, aby coś zrobić. Teraz komputery krążą nad nami, jakby w powietrzu. Są wsłuchane. Są pomocne. Są wszędzie” – pisze z kolei „The New York Times”. To miłe, gdy bez znajomości numeru lotu można spytać inteligentny głośnik o to, kiedy odlatuje twój samolot. Urządzenie samo przejrzy twoje maile i kalendarz, aby udzielić prawidłowej odpowiedzi. I zgodnie z życzeniem znajdzie „trzy- lub czterogwiazdkowy hotel w Londynie na najbliższy piątek za mniej niż 150 funtów”. Ale co, jeśli puszczona samopas inteligencja zacznie ci wypominać wykroczenia na drodze? Przejrzy wyniki badań medycznych i skonfrontuje je z ostatnimi zakupami? A po domowej kłótni zamówi bukiet kwiatów – i przy okazji zawiadomi policję? Oczywiście wszystko dla naszego dobra.
Prędzej czy później zaakceptujemy w domu nowego gadającego i wścibskiego członka rodziny, odpowiednio przygotowani przez Hollywood.