deepseek nowy model

DeepSeek wprowadza nową AI. Co wyróżnia chiński model?

Chiński DeepSeek ogłosił w poniedziałek premierę eksperymentalnej wersji swojego najnowszego modelu AI – DeepSeek-V3.2-Exp.

Nowa AI ma zwiększać wydajność i zdolność przetwarzania dużych ilości danych przy znacznie niższych kosztach. Choć pojawiają się pry tym pytania o jej skuteczność i bezpieczeństwo architektury.

W ubiegłym roku DeepSeek zaskoczył Dolinę Krzemową, wprowadzając model R1. Pokazał w ten sposób, że trening dużych modeli językowych (LLM) można przeprowadzać szybciej, na słabszych układach i przy mniejszym zużyciu zasobów. Teraz firma idzie dalej, koncentrując się na efektywności i dalej otwartym udostępnianiu rozwiązań.

Sparse Attention – klucz do efektywności

Najważniejszą nowością w DeepSeek-V3.2 jest funkcja DSA (DeepSeek Sparse Attention). Pozwala AI lepiej radzić sobie z długimi dokumentami i rozmowami. Jednocześnie zmniejsza koszty obsługi modelu o połowę w porównaniu do poprzedniej wersji.

– To istotne, bo model staje się szybszy i tańszy w użyciu bez zauważalnego spadku wydajności – podkreśla Nick Patience, wiceprezes The Futurum Group w rozmowie z CNBC. – Dzięki temu potężna sztuczna inteligencja staje się dostępna dla deweloperów, naukowców i mniejszych firm, co może prowadzić do fali nowych, innowacyjnych aplikacji.

Sparse attention działa na zasadzie filtrowania danych. Model koncentruje się tylko na tych informacjach, które są istotne dla konkretnego zadania, zamiast przetwarzać całość danych jak tradycyjne modele.

Zaletą takie podejście jest  mniejsze zużycie zasobów i łatwiejsza skalowalność. Wadą – obawy o utracone niuanse i potencjalne ryzyko błędnych wniosków. Jak to działa w praktyce, zaraz się przekonamy.

Nowy DeepSeek dla każdego, kto chce

DeepSeek udostępnił kod i narzędzia potrzebne do korzystania z nowego eksperymentalnego modelu. Umożliwiając też tym samym tworzenie własnych udoskonaleń. 

Foto: Gemini/AI.

Podziel się artykułem

PortalTechnologiczny.pl

Wykorzystujemy ciasteczka do spersonalizowania treści i reklam, aby oferować funkcje społecznościowe i analizować ruch w naszej witrynie.

Informacje o tym, jak korzystasz z naszej witryny, udostępniamy partnerom społecznościowym, reklamowym i analitycznym. Partnerzy mogą połączyć te informacje z innymi danymi otrzymanymi od Ciebie lub uzyskanymi podczas korzystania z ich usług.

Informacja o tym, w jaki sposób Google przetwarza dane, znajdują się tutaj.