Naukowcy chyba zrozumieli dlaczego najlepsze sztuczne inteligencje grają doskonale w szachy i inne złożone gry strategiczne ale przegrywają z kretesem w prostych grach matematycznych.
Systemy sztucznej inteligencji opracowane przez DeepMind, należące do Google, od lat uznawane są za przełom w dziedzinie uczenia maszynowego. Algorytmy z serii AlphaGo czy AlphaZero nauczyły się grać w niezwykle złożone gry strategiczne – takie jak Go czy szachy – osiągając poziom przewyższający najlepszych ludzi.
Jednak nowe badanie pokazuje coś zaskakującego. Metoda treningu, która działa doskonale w skomplikowanych grach strategicznych, może kompletnie zawodzić w przypadku znacznie prostszych gier matematycznych.
Gra Nim – prosta, ale wymagająca matematyki
Badacze przyjrzeli się grze Nim, klasycznej łamigłówce znanej od ponad wieku.
Jej zasady są niezwykle proste. Na planszy układa się rzędy zapałek w kształcie piramidy. Gracze na zmianę wybierają jeden rząd i zabierają z niego dowolną liczbę zapałek. Przegrywa osoba, która nie ma już legalnego ruchu.
Choć brzmi to jak prosta gra dla dzieci, Nim ma bardzo ciekawą właściwość:
dla każdej pozycji można matematycznie obliczyć, który gracz ma przewagę i czy jest w stanie wygrać przy optymalnej grze.
Wystarczy zastosować tzw. funkcję parzystości, która analizuje konfigurację zapałek i wskazuje, czy dana pozycja jest wygrywająca czy przegrywająca.
Dlaczego metoda AlphaGo tu nie działa
Systemy takie jak AlphaZero uczą się poprzez samodzielne rozgrywanie milionów partii przeciwko sobie. W trakcie treningu budują statystyczne powiązania między:
- konfiguracją planszy
- prawdopodobieństwem zwycięstwa
W grach takich jak szachy działa to znakomicie. Z czasem AI zaczyna rozpoznawać dobre ruchy i eksplorować kolejne scenariusze gry.
Problem pojawia się w Nim.
W tej grze optymalne ruchy wynikają z konkretnej reguły matematycznej. Jeśli AI jej nie odkryje, nie jest w stanie systematycznie wygrywać – nawet jeśli rozegra tysiące partii.
Eksperyment pokazał poważną słabość AI
Badanie przeprowadzone przez Bei Zhou i Soren Riis, opublikowane w czasopiśmie Machine Learning, pokazało skalę problemu.
Wyniki były zaskakujące:
- przy planszy z 5 rzędami zapałek AI szybko się poprawiała
- przy 6 rzędach postęp dramatycznie zwolnił
- przy 7 rzędach system praktycznie przestał się uczyć
Co więcej, gdy naukowcy zastąpili mechanizm sugerowania ruchów losowym wyborem, efekty były niemal identyczne jak w przypadku wytrenowanej AI.
Innymi słowy: algorytm, który pokonał mistrzów świata w szachach, w tej grze nie radził sobie lepiej niż czysty przypadek.
Problem leży w sposobie uczenia
Według autorów badania systemy takie jak AlphaZero świetnie uczą się skojarzeń statystycznych, ale mają problem z odkrywaniem symbolicznych reguł matematycznych.
W Nim kluczowe jest zrozumienie ogólnej zasady – funkcji parzystości – która decyduje o wyniku gry. AI trenowana metodą samodzielnej gry nie potrafi tej reguły samodzielnie odkryć.
To oznacza tzw. katastrofalny tryb awarii – sytuację, w której system działa bardzo dobrze w większości przypadków, ale całkowicie zawodzi w pewnych typach problemów.
Podobne problemy mogą występować nawet w szachach
Badacze zauważyli, że podobne zjawisko może pojawiać się również w szachach.
W niektórych pozycjach AI początkowo uznawała błędne ruchy za dobre, ponieważ nie rozpoznawała dalekosiężnych kombinacji prowadzących do mata. Dopiero analiza wielu wariantów kilka ruchów wprzód pozwalała uniknąć poważnej pomyłki.
W praktyce oznacza to, że słabości tego typu istnieją także w bardziej złożonych grach – są jedynie rzadsze.
Dlaczego to ważne dla przyszłości AI
Wnioski z badania mogą mieć znaczenie daleko wykraczające poza gry.
Coraz więcej projektów próbuje wykorzystywać AI do:
- rozwiązywania problemów matematycznych
- odkrywania nowych twierdzeń
- wspomagania badań naukowych
Tymczasem wiele takich zadań wymaga symbolicznego rozumowania, a nie tylko analizy statystycznych wzorców.
Badanie sugeruje więc, że obecne metody treningu – tak skuteczne w grach strategicznych – mogą nie wystarczyć do rozwiązywania bardziej abstrakcyjnych problemów matematycznych.
Foto: Pixabay.