Gemini 3.1

Najmocniejsza AI świata? Gemini 3.1 Pro rozbija benchmarki

Google zaprezentował nową wersję swojego zaawansowanego modelu językowego — Gemini 3.1 Pro. Model jest obecnie dostępny w wersji preview, a pełna premiera ma nastąpić wkrótce.

Według pierwszych analiz branżowych, Gemini 3.1 Pro to wyraźny krok naprzód względem poprzedniej wersji — Gemini 3. A to już w listopadzie uchodziła za jedno z najbardziej zaawansowanych narzędzi AI na rynku.

Rekordowe wyniki w niezależnych benchmarkach

Google opublikował dane z niezależnych testów wydajności, w tym z benchmarku Humanity’s Last Exam. Pokazują znaczącą poprawę względem poprzedniej generacji modelu.

Szczególne uznanie Gemini 3.1 Pro zdobył w testach mierzących praktyczne zastosowania biznesowe i tzw. „agentic work” — czyli wykonywanie wieloetapowych zadań wymagających planowania, analizy i samodzielnego podejmowania decyzji przez AI.

Brendan Foody, CEO startupu Mercor, którego system testowy APEX mierzy skuteczność modeli AI w realnych zadaniach zawodowych, poinformował, że Gemini 3.1 Pro objął prowadzenie w rankingu APEX-Agents. Jak podkreślił, wyniki pokazują, jak szybko modele AI rozwijają się w zakresie pracy opartej na wiedzy.

Wojna modeli AI nabiera tempa

Premiera Gemini 3.1 Pro wpisuje się w coraz ostrzejszy wyścig technologiczny między największymi graczami rynku AI. Firmy prześcigają się w tworzeniu modeli zdolnych do:

  • zaawansowanego rozumowania wieloetapowego
  • autonomicznego działania w roli „agentów AI”
  • przetwarzania złożonych zadań biznesowych
  • integracji z narzędziami produktywności i systemami firmowymi

W ostatnich tygodniach nowe modele zaprezentowały także OpenAI oraz Anthropic, co dodatkowo podgrzewa rywalizację w sektorze LLM.

Co oznacza Gemini 3.1 Pro dla rynku?

Nowa wersja modelu Google może mieć istotne znaczenie dla sektora enterprise oraz startupów budujących tzw. agentów AI. Jeśli deklarowane wyniki znajdą potwierdzenie w praktyce, Gemini 3.1 Pro może stać się jednym z najważniejszych narzędzi dla firm automatyzujących analizę danych, research, obsługę klienta czy procesy decyzyjne.

Wyścig modeli językowych coraz wyraźniej przesuwa się z „kto ma większy model” w stronę „kto lepiej radzi sobie z realną pracą”. A w tej kategorii Google właśnie zgłosił bardzo mocną kandydaturę do lidera.

Foto: Alphabet.

Podziel się artykułem

PortalTechnologiczny.pl

Wykorzystujemy ciasteczka do spersonalizowania treści i reklam, aby oferować funkcje społecznościowe i analizować ruch w naszej witrynie.

Informacje o tym, jak korzystasz z naszej witryny, udostępniamy partnerom społecznościowym, reklamowym i analitycznym. Partnerzy mogą połączyć te informacje z innymi danymi otrzymanymi od Ciebie lub uzyskanymi podczas korzystania z ich usług.

Informacja o tym, w jaki sposób Google przetwarza dane, znajdują się tutaj.