Nauka

Triumf AI. Programy komputerowe pokonały ludzi w grach, w których nie powinny

Mistrz świata w szachach Garry Kasparow studiuje planszę na krótko przed drugą partią meczu z superkomputerem IBM Deep Blue. Mistrz świata w szachach Garry Kasparow studiuje planszę na krótko przed drugą partią meczu z superkomputerem IBM Deep Blue. Reuters Photographer / Forum
Naukowcy z dwóch firm pracujących nad sztuczną inteligencją osiągnęli spektakularny sukces. Nauczyli komputer negocjować, zawierać sojusze, zdradzać i blefować. A także mówić po ludzku.

Ćwierć wieku temu doszło do wydarzenia, o którym zrobiło się głośno na całym świecie. Zbudowany przez koncern IBM superkomputer Deep Blue – o mocy obliczeniowej, która lokowała go mniej więcej w połowie ówczesnej listy 500 najpotężniejszych maszyn – pokonał w blasku kamer słynnego szachowego mistrza Garriego Kasparowa: 3,5 do 2,5. W ten sposób Deep Blue stał się pierwszym systemem komputerowym, który wygrał z aktualnym mistrzem świata w meczu ze standardową kontrolą czasu.

Czytaj także: Głębokie sieci neuronowe. Uczą się jak człowiek, tylko lepiej i dokładniej

Deep Blue wygrywa z Kasparowem, stosując „metodę siłową”

Zwycięstwo komputera nad człowiekiem opisywano jako niemal epokowe wydarzenie, gdyż po raz pierwszy sztuczna inteligencja pokonała człowieka (meczowi z Kasparowem poświęcono nawet sztukę teatralną, a fragment Deep Blue trafił do National Museum of American History w Waszyngtonie). Aczkolwiek komputer IBM nie był ani trochę inteligentny na ludzki sposób. Wygrał dzięki zastosowaniu algorytmów, które na bieżąco oceniały, czy np. ważniejsze jest zabezpieczenie pozycji króla, czy zdobycie przewagi w środku pola dzięki ruchowi pionka.

Maszyna robiła to na podstawie danych zebranych z tysięcy gier szachowych mistrzów i uzyskała przewagę nad człowiekiem przede wszystkim dzięki temu, co określa się w naukach komputerowych jako „metoda siłowa” lub „wyszukiwanie wyczerpujące”. Dzięki ogromnej mocy obliczeniowej Deep Blue analizował wszystkie potencjalne rozwiązania zadania (w tym wypadku układu figur szachowych) w celu wybrania tego, które dawało przewagę i prowadziło do zwycięstwa.

Czytaj także: Realnie o sztucznej inteligencji

Szachy są jednak pod pewnym względem grą łatwą dla komputerów: nie wymagają komunikacji z przeciwnikiem, podlegają jasnym regułom i wszystko, co się dzieje na szachownicy, jest widoczne dla obydwu stron, począwszy od wyjściowego ustawienia bierek. Nieporównanie trudniejszym zadaniem dla maszyn są gry, w których nie mamy pełnych danych, przeciwnik może blefować, a ponadto trzeba się komunikować z uczestnikami gry. Czyli robić rzeczy, które wydają się zupełnie poza zasięgiem nawet najmocniejszych maszyn i najbardziej wyrafinowanych programów komputerowych. A raczej wydawały, gdyż dwie publikacje naukowe w dwóch ostatnich numerach prestiżowego tygodnika „Science” ogłaszają ogromny przełom na tym polu.

DeepNash umie blefować

Naukowcy pracujący nad sztuczną inteligencją postanowili zmierzyć się z dwiema klasycznymi, bo liczącymi już co najmniej kilkadziesiąt lat, grami planszowymi. Ponieważ powstały również ich wersje cyfrowe, w tym dające możliwość prowadzenia rozgrywek online, maszyny mogły spróbować swych sił z ludzkimi przeciwnikami.

Badacze z brytyjskiej firmy DeepMind Technologies, należącej od 2014 r. do Google’a, prezentują na łamach najnowszego „Science” program komputerowy DeepNash. Jego nazwa nawiązuje do amerykańskiego matematyka i laureata ekonomicznego Nobla Johna Nasha, którego historia została zekranizowana w słynnym filmie „Piękny umysł”. Zajmował się on m.in. teorią gier i wprowadził tzw. równowagę Nasha. W dużym uproszczeniu polega ona na tym, że przy ustalonych strategiach przeciwników żadnemu z graczy nie opłaca się zmienić swojej strategii. A zatem gracz przyjmuje optymalne rozwiązanie ze względu na działania innych graczy.

DeepNash wykorzystuje ten koncept, jak również uczące się sieci neuronowe i inne skomplikowane narzędzia z pogranicza informatyki i teorii gier. Dzięki nim udało mu się pokonać w grę o nazwie Stratego nie tylko inne programy komputerowe, ale przede wszystkim znaleźć się wśród trzech najlepszych ludzkich graczy na internetowej platformie Gravon (ze wskaźnikiem zwycięstw na poziomie 84 proc.). To ogromne osiągnięcie, gdyż do tej pory komputery były w stanie osiągać jedynie poziom ludzkich amatorów.

Czytaj także: Nowa era gier planszowych

A gra ta już na samym początku rozgrywki bardzo wysoko zawiesza poprzeczkę, gdyż na planszy widać jedynie wyjściowe rozstawienie bierek przeciwnika, ale nie wiadomo, co się za każdą z nich kryje, tzn. jaką siłę ma dana bierka (dlatego istnieje 1066 możliwych wyjściowych ustawień obu graczy). Co to za bierka, ujawnia się dopiero w „walce”, czyli jeśli wkroczy się na zajęte przez przeciwnika pole. W Stratego istnieje jeszcze co najmniej kilka innych elementów rozgrywki sprawiających, że można blefować i podpuszczać drugiego gracza. Czyli robić rzeczy będące ogromną przeszkodą dla sztucznej inteligencji.

Cyceron rozmawia i oszukuje ludzi

Chyba jeszcze trudniejsze zadanie postawili sobie naukowcy pracujący dla Meta AI, czyli laboratorium sztucznej inteligencji Facebooka (o czym piszą w poprzednim wydaniu „Science”). Wzięli mianowicie „na warsztat” grę planszową Dyplomacja. Jej akcja toczy się w Europie na początku XX w., gdzie o dominację rywalizuje kilka krajów. Wygrywa ten, kto dzięki sprytnym ruchom wojsk opanuje odpowiednią liczbę „centrów zaopatrzenia”. Sednem „Dyplomacji” nie są jednak zmyślne posunięcia na planszy, ale negocjacje z pozostałymi kilkoma graczami. Trzeba bowiem zawierać sojusze, a w odpowiednim momencie zdradzać, by zyskać przewagę. Dlatego w wersjach online „Dyplomacji” rundy negocjacji odbywają się w okienkach czatów.

Stworzony przez naukowców z Meta AI program komputerowy o nazwie Cyceron za każdym razem nie tylko analizował i starał się zrozumieć motywacje ludzkich graczy, ale również próbował wzbudzać ich zaufanie. A musiał to robić, komunikując się z nimi na czacie (używając zwykłego ludzkiego języka), gdzie budował sojusze i proponował różne posunięcia. A później zdradzał i przewidywał zdrady.

Cyceron wziął udział w 40 rozgrywkach online typu „blitz” (z ograniczoną do 5 min turą negocjacji). I znalazł się wśród 10 proc. najlepszych ludzkich graczy, którzy wzięli udział w co najmniej jednej grze. Triumfował też w miniturnieju 21 graczy (każdy wziął udział w sześciu grach). Jednym z najbardziej niesamowitych osiągnięć Cycerona okazało się wymienienie z ludźmi prawie 5,3 tys. wiadomości na czacie. I tylko jedna osoba w pewnym momencie nabrała podejrzeń, że ma do czynienia z botem komputerowym.

Czytaj także: Czy sztuczna inteligencja dorówna ludzkiej?

Jak piszą naukowcy na łamach „Science”, nauczenie Cycerona posługiwania się naturalnym językiem i adekwatnego odpowiadania na propozycje, jak również ich składania, było największym wyzwaniem. Co ciekawe, programowi zdarzało się popełniać błędy podczas komunikacji, ale również one wyglądały na ludzkie.

Więcej na ten temat
Reklama

Czytaj także

null
Rynek

Siostrom tlen! Pielęgniarki mają dość. Dla niektórych wielka podwyżka okazała się obniżką

Nabite w butelkę przez poprzedni rząd PiS i Suwerennej Polski czują się nie tylko pielęgniarki, ale także dyrektorzy szpitali. System publicznej ochrony zdrowia wali się nie tylko z braku pieniędzy, ale także z braku odpowiedzialności i wyobraźni.

Joanna Solska
11.10.2024
Reklama

Ta strona do poprawnego działania wymaga włączenia mechanizmu "ciasteczek" w przeglądarce.

Powrót na stronę główną