Anthropic wypuszcza najnowszą wersję swojego flagowego modelu sztucznej inteligencji. Claude Opus 4.5 to pierwszy model AI, który przekroczył 80% skuteczności w renomowanym benchmarku kodowania SWE-Bench.
24 listopada firma Anthropic oficjalnie zaprezentowała Claude Opus 4.5 – ostatni i najbardziej zaawansowany z serii modeli 4.5. Dołącza do wydanych wcześniej Sonnet 4.5 (wrzesień 2025) i Haiku 4.5 (październik 2025). Nowa wersja Opusa osiąga bardzo dobre wyniki w szeregu branżowych testów wydajności.
Model jako pierwszy w historii przekroczył np. barierę 80% w zweryfikowanym teście SWE-Bench, ustanawiając nowy standard dla AI w kodowaniu. Doskonałe wyniki osiągnął również w benchmarku Terminal-bench.

Opus 4.5 wykazuje zaawansowane umiejętności także w testach tau2-bench oraz MCP Atlas, co przekłada się na lepszą integrację z różnorodnymi aplikacjami. Z kolei w testach ARC-AGI 2 i GPQA Diamond model potwierdził swoje możliwości w zakresie ogólnego rozumowania i rozwiązywania złożonych zagadnień.
Claude dla Chrome i Excela
Wraz z premierą Opus 4.5, Anthropic udostępnia szerszej grupie użytkowników dwa kluczowe produkty. Pierwszym z nich jest Claude dla Chrome. To rozszerzenie do popularnej przeglądarki dostępne dla wszystkich użytkowników planu Max, umożliwiające bezpośrednią interakcję z modelem podczas przeglądania internetu.
Drugą istotną nowością jest Claude dla Excel. To z kolei zaawansowane narzędzie do pracy z arkuszami kalkulacyjnymi, dostępne dla użytkowników planów Max, Team oraz Enterprise. Model, dzięki niemu, wykazuje szczególnie wysoką skuteczność w operacjach na danych tabelarycznych.
Rewolucja w zarządzaniu pamięcią
Jedną z najbardziej innowacyjnych cech Opus 4.5 jest przeprojektowane podejście do zarządzania pamięcią długoterminową.
– Wprowadziliśmy ulepszenia w ogólnej jakości długiego kontekstu podczas treningu Opus 4.5, ale same okna kontekstowe nie wystarczą. Umiejętność zapamiętywania właściwych szczegółów jest naprawdę istotna jako uzupełnienie dłuższego okna kontekstowego – tłumaczy Dianne Na Penn, kierownik zarządzania produktem w dziale badawczym Anthropic.
Zmiany w architekturze pamięci umożliwiły wprowadzenie długo wyczekiwanej funkcji dla płatnych użytkowników Claude – rozmowy bez przerw. Gdy model osiągnie limit okna kontekstowego, automatycznie kompresuje swoją pamięć kontekstową bez powiadamiania użytkownika, co zapewnia płynność interakcji.
Agentic AI – przyszłość autonomicznych systemów
Wiele ulepszeń w Opus 4.5 zostało zaprojektowanych z myślą o zastosowaniach agentowych. Szczególnie w scenariuszach, gdzie Opus pełni rolę głównego agenta koordynującego grupę pod-agentów opartych na modelu Haiku.
– To właśnie tutaj fundamentalne elementy takie jak pamięć stają się naprawdę istotne – wyjaśnia Penn. – Claude musi być w stanie eksplorować bazy kodu i duże dokumenty, a także wiedzieć, kiedy należy cofnąć się i ponownie coś sprawdzić.
Ta funkcjonalność otwiera drzwi do budowy przez deweloperów złożonych systemów AI, zdolnych do samodzielnego zarządzania wieloetapowymi projektami programistycznymi i analitycznymi.
Konkurencja na rynku modeli AI
Claude Opus 4.5 wchodzi na rynek w czasie intensywnej konkurencji między największymi graczami branży AI. Model będzie musiał zmierzyć się z niedawno wydanymi GPT 5.1 od OpenAI, który zadebiutował 12 listopada i Gemini 3 od Google, który pojawił się 6 dni później.
Doskonałe wyniki w benchmarkach kodowania, innowacyjne podejście do zarządzania pamięcią oraz nowe integracje z popularnymi narzędziami takimi jak Chrome i Excel czynią go jednym z najbardziej wszechstronnych modeli AI dostępnych obecnie na rynku. Jednak na pytanie, czy spełnia naszej konkretne oczekiwania, każdy będzie musiał sobie odpowiedzieć samodzielnie.
Jedno jest pewne. Dla programistów, analityków danych i firm poszukujących zaawansowanych rozwiązań AI, Opus 4.5 oferuje możliwości, które jeszcze niedawno wydawały się nieosiągalne.
Foto: Anthropic.