Szachy

AI wygrywa z arcymistrzami w szachy, ale nie radzi sobie z prostą grą

Naukowcy chyba zrozumieli dlaczego najlepsze sztuczne inteligencje grają doskonale w szachy i inne złożone gry strategiczne ale przegrywają z kretesem w prostych grach matematycznych.

Systemy sztucznej inteligencji opracowane przez DeepMind, należące do Google, od lat uznawane są za przełom w dziedzinie uczenia maszynowego. Algorytmy z serii AlphaGo czy AlphaZero nauczyły się grać w niezwykle złożone gry strategiczne – takie jak Go czy szachy – osiągając poziom przewyższający najlepszych ludzi.

Jednak nowe badanie pokazuje coś zaskakującego. Metoda treningu, która działa doskonale w skomplikowanych grach strategicznych, może kompletnie zawodzić w przypadku znacznie prostszych gier matematycznych.

Gra Nim – prosta, ale wymagająca matematyki

Badacze przyjrzeli się grze Nim, klasycznej łamigłówce znanej od ponad wieku.

Jej zasady są niezwykle proste. Na planszy układa się rzędy zapałek w kształcie piramidy. Gracze na zmianę wybierają jeden rząd i zabierają z niego dowolną liczbę zapałek. Przegrywa osoba, która nie ma już legalnego ruchu.

Choć brzmi to jak prosta gra dla dzieci, Nim ma bardzo ciekawą właściwość:
dla każdej pozycji można matematycznie obliczyć, który gracz ma przewagę i czy jest w stanie wygrać przy optymalnej grze.

Wystarczy zastosować tzw. funkcję parzystości, która analizuje konfigurację zapałek i wskazuje, czy dana pozycja jest wygrywająca czy przegrywająca.

Dlaczego metoda AlphaGo tu nie działa

Systemy takie jak AlphaZero uczą się poprzez samodzielne rozgrywanie milionów partii przeciwko sobie. W trakcie treningu budują statystyczne powiązania między:

  • konfiguracją planszy
  • prawdopodobieństwem zwycięstwa

W grach takich jak szachy działa to znakomicie. Z czasem AI zaczyna rozpoznawać dobre ruchy i eksplorować kolejne scenariusze gry.

Problem pojawia się w Nim.

W tej grze optymalne ruchy wynikają z konkretnej reguły matematycznej. Jeśli AI jej nie odkryje, nie jest w stanie systematycznie wygrywać – nawet jeśli rozegra tysiące partii.

Eksperyment pokazał poważną słabość AI

Badanie przeprowadzone przez Bei Zhou i Soren Riis, opublikowane w czasopiśmie Machine Learning, pokazało skalę problemu.

Wyniki były zaskakujące:

  • przy planszy z 5 rzędami zapałek AI szybko się poprawiała
  • przy 6 rzędach postęp dramatycznie zwolnił
  • przy 7 rzędach system praktycznie przestał się uczyć

Co więcej, gdy naukowcy zastąpili mechanizm sugerowania ruchów losowym wyborem, efekty były niemal identyczne jak w przypadku wytrenowanej AI.

Innymi słowy: algorytm, który pokonał mistrzów świata w szachach, w tej grze nie radził sobie lepiej niż czysty przypadek.

Problem leży w sposobie uczenia

Według autorów badania systemy takie jak AlphaZero świetnie uczą się skojarzeń statystycznych, ale mają problem z odkrywaniem symbolicznych reguł matematycznych.

W Nim kluczowe jest zrozumienie ogólnej zasady – funkcji parzystości – która decyduje o wyniku gry. AI trenowana metodą samodzielnej gry nie potrafi tej reguły samodzielnie odkryć.

To oznacza tzw. katastrofalny tryb awarii – sytuację, w której system działa bardzo dobrze w większości przypadków, ale całkowicie zawodzi w pewnych typach problemów.

Podobne problemy mogą występować nawet w szachach

Badacze zauważyli, że podobne zjawisko może pojawiać się również w szachach.

W niektórych pozycjach AI początkowo uznawała błędne ruchy za dobre, ponieważ nie rozpoznawała dalekosiężnych kombinacji prowadzących do mata. Dopiero analiza wielu wariantów kilka ruchów wprzód pozwalała uniknąć poważnej pomyłki.

W praktyce oznacza to, że słabości tego typu istnieją także w bardziej złożonych grach – są jedynie rzadsze.

Dlaczego to ważne dla przyszłości AI

Wnioski z badania mogą mieć znaczenie daleko wykraczające poza gry.

Coraz więcej projektów próbuje wykorzystywać AI do:

  • rozwiązywania problemów matematycznych
  • odkrywania nowych twierdzeń
  • wspomagania badań naukowych

Tymczasem wiele takich zadań wymaga symbolicznego rozumowania, a nie tylko analizy statystycznych wzorców.

Badanie sugeruje więc, że obecne metody treningu – tak skuteczne w grach strategicznych – mogą nie wystarczyć do rozwiązywania bardziej abstrakcyjnych problemów matematycznych.

Foto: Pixabay.

Podziel się artykułem

PortalTechnologiczny.pl

Wykorzystujemy ciasteczka do spersonalizowania treści i reklam, aby oferować funkcje społecznościowe i analizować ruch w naszej witrynie.

Informacje o tym, jak korzystasz z naszej witryny, udostępniamy partnerom społecznościowym, reklamowym i analitycznym. Partnerzy mogą połączyć te informacje z innymi danymi otrzymanymi od Ciebie lub uzyskanymi podczas korzystania z ich usług.

Informacja o tym, w jaki sposób Google przetwarza dane, znajdują się tutaj.