Claude Opus 4.5

Claude Opus 4.5 – nowy model AI od Anthropic. Programuje jak żaden

Anthropic wypuszcza najnowszą wersję swojego flagowego modelu sztucznej inteligencji. Claude Opus 4.5 to pierwszy model AI, który przekroczył 80% skuteczności w renomowanym benchmarku kodowania SWE-Bench.

24 listopada firma Anthropic oficjalnie zaprezentowała Claude Opus 4.5 – ostatni i najbardziej zaawansowany z serii modeli 4.5. Dołącza do wydanych wcześniej Sonnet 4.5 (wrzesień 2025) i Haiku 4.5 (październik 2025). Nowa wersja Opusa osiąga bardzo dobre wyniki w szeregu branżowych testów wydajności.

Model jako pierwszy w historii przekroczył np. barierę 80% w zweryfikowanym teście SWE-Bench, ustanawiając nowy standard dla AI w kodowaniu. Doskonałe wyniki osiągnął również w benchmarku Terminal-bench.

Opus 4.5 wykazuje zaawansowane umiejętności także w testach tau2-bench oraz MCP Atlas, co przekłada się na lepszą integrację z różnorodnymi aplikacjami. Z kolei w testach ARC-AGI 2 i GPQA Diamond model potwierdził swoje możliwości w zakresie ogólnego rozumowania i rozwiązywania złożonych zagadnień.

Claude dla Chrome i Excela

Wraz z premierą Opus 4.5, Anthropic udostępnia szerszej grupie użytkowników dwa kluczowe produkty. Pierwszym z nich jest Claude dla Chrome. To rozszerzenie do popularnej przeglądarki dostępne dla wszystkich użytkowników planu Max, umożliwiające bezpośrednią interakcję z modelem podczas przeglądania internetu.

Drugą istotną nowością jest Claude dla Excel. To z kolei zaawansowane narzędzie do pracy z arkuszami kalkulacyjnymi, dostępne dla użytkowników planów Max, Team oraz Enterprise. Model, dzięki niemu, wykazuje szczególnie wysoką skuteczność w operacjach na danych tabelarycznych.

Rewolucja w zarządzaniu pamięcią

Jedną z najbardziej innowacyjnych cech Opus 4.5 jest przeprojektowane podejście do zarządzania pamięcią długoterminową. 

– Wprowadziliśmy ulepszenia w ogólnej jakości długiego kontekstu podczas treningu Opus 4.5, ale same okna kontekstowe nie wystarczą. Umiejętność zapamiętywania właściwych szczegółów jest naprawdę istotna jako uzupełnienie dłuższego okna kontekstowego – tłumaczy Dianne Na Penn, kierownik zarządzania produktem w dziale badawczym Anthropic.

Zmiany w architekturze pamięci umożliwiły wprowadzenie długo wyczekiwanej funkcji dla płatnych użytkowników Claude – rozmowy bez przerw. Gdy model osiągnie limit okna kontekstowego, automatycznie kompresuje swoją pamięć kontekstową bez powiadamiania użytkownika, co zapewnia płynność interakcji.

Agentic AI – przyszłość autonomicznych systemów

Wiele ulepszeń w Opus 4.5 zostało zaprojektowanych z myślą o zastosowaniach agentowych. Szczególnie w scenariuszach, gdzie Opus pełni rolę głównego agenta koordynującego grupę pod-agentów opartych na modelu Haiku.

– To właśnie tutaj fundamentalne elementy takie jak pamięć stają się naprawdę istotne – wyjaśnia Penn. – Claude musi być w stanie eksplorować bazy kodu i duże dokumenty, a także wiedzieć, kiedy należy cofnąć się i ponownie coś sprawdzić.

Ta funkcjonalność otwiera drzwi do budowy przez deweloperów złożonych systemów AI, zdolnych do samodzielnego zarządzania wieloetapowymi projektami programistycznymi i analitycznymi.

Konkurencja na rynku modeli AI

Claude Opus 4.5 wchodzi na rynek w czasie intensywnej konkurencji między największymi graczami branży AI. Model będzie musiał zmierzyć się z niedawno wydanymi GPT 5.1 od OpenAI, który zadebiutował 12 listopada i Gemini 3 od Google, który pojawił się 6 dni później.

Doskonałe wyniki w benchmarkach kodowania, innowacyjne podejście do zarządzania pamięcią oraz nowe integracje z popularnymi narzędziami takimi jak Chrome i Excel czynią go jednym z najbardziej wszechstronnych modeli AI dostępnych obecnie na rynku. Jednak na pytanie, czy spełnia naszej konkretne oczekiwania, każdy będzie musiał sobie odpowiedzieć samodzielnie. 

Jedno jest pewne. Dla programistów, analityków danych i firm poszukujących zaawansowanych rozwiązań AI, Opus 4.5 oferuje możliwości, które jeszcze niedawno wydawały się nieosiągalne. 

Foto: Anthropic.

Podziel się artykułem

PortalTechnologiczny.pl

Wykorzystujemy ciasteczka do spersonalizowania treści i reklam, aby oferować funkcje społecznościowe i analizować ruch w naszej witrynie.

Informacje o tym, jak korzystasz z naszej witryny, udostępniamy partnerom społecznościowym, reklamowym i analitycznym. Partnerzy mogą połączyć te informacje z innymi danymi otrzymanymi od Ciebie lub uzyskanymi podczas korzystania z ich usług.

Informacja o tym, w jaki sposób Google przetwarza dane, znajdują się tutaj.