DeepSeek V4 preview: open source kontra OpenAI i Anthropic

Q: Czy open source znów wygra z zamkniętymi gigantami?

DeepSeek wrzucił preview modelu V4 — rok po tym, jak V3 wstrząsnął Silicon Valley. Firma twierdzi, że open-source bije zamknięte systemy rywali.

Q: Co to oznacza dla rynku infrastruktury AI?

DeepSeek wrzucił preview modelu V4 — rok po tym, jak V3 wstrząsnął Silicon Valley. Firma twierdzi, że open-source bije zamknięte systemy rywali.

DeepSeek opublikował w piątek preview swojego modelu V4, zapowiadając że open-source’owa architektura pobije zamknięte systemy Anthropic, Google i OpenAI.

Rok po trzęsieniu ziemi

Dokładnie rok temu DeepSeek V3 zrobił z branży AI szach-mat. Akcje Nvidii spadły o 17% w jeden dzień, a Wall Street odkryło, że można trenować modele klasy światowej za ułamek tego, co wydaje OpenAI. Tamta premiera kosztowała amerykańskich gigantów technologicznych łącznie setki miliardów dolarów kapitalizacji w ciągu kilku sesji.

V4 to zapowiadany następca tego samego modelu. DeepSeek twierdzi, że to znaczący skok jakościowy ponad V3 — firma nie podała jeszcze pełnych benchmarków, bo to na razie preview, nie finalne wydanie.

Czy open source znów wygra z zamkniętymi gigantami?

DeepSeek konsekwentnie stawia na otwartą dystrybucję modeli — i to jest ich główny cios w stronę Anthropic czy OpenAI, które trzymają wagi za zamkniętymi drzwiami. Każdy może pobrać model, odpalić lokalnie, sforkować i dostosować. Żadnych limitów API, żadnych kosztów per token.

Strategia działa. V3 trafił na szczyt rankingów na Hugging Face niemal natychmiast po premierze i przez tygodnie bił modele od Meta, Mistral czy innych graczy open-source. Deweloperzy zaczęli masowo migrować projekty, bo wydajność była porównywalna z GPT-4, a cena hostingu — minimalna.

V4 celuje jeszcze wyżej. Firma deklaruje konkurencyjność z najnowszymi zamkniętymi systemami, co w praktyce oznacza Claude 3.5 Sonnet, Gemini 1.5 Pro i GPT-4o. To ambitne twierdzenie, które zweryfikuje społeczność — benchmark-hunting zacznie się natychmiast po pełnym wypuszczeniu modelu.

Techniczne detale wciąż skąpe

Preview to preview. DeepSeek nie podał jeszcze pełnych specyfikacji: ile parametrów, jaka architektura, czy to dalej Mixture of Experts jak w V3, jakie kontekstowe okno. To normalna praktyka przed oficjalną premierą, ale branża jest niecierpliwa.

V3 działał na architekturze MoE z 671 miliardami parametrów, z których aktywnych było jednocześnie tylko 37 miliardów — to dlatego był tańszy w inferencji niż gęste modele konkurentów. Jeśli V4 idzie tym tropem i go ulepsza, koszty działania mogą być jeszcze niższe.

Co to oznacza dla rynku infrastruktury AI?

Każda mocna premiera DeepSeek uderza nie tylko w laboratoria AI, ale też w firmy sprzedające dostęp do mocy obliczeniowej. Tańsze i wydajniejsze modele open-source oznaczają mniejsze zapotrzebowanie na drogie klastry GPU — przynajmniej w teorii.

Nvidia obserwuje tę sytuację uważnie. Jensen Huang kilkukrotnie publicznie komentował DeepSeek, próbując tłumaczyć, że wydajne modele tylko zwiększają popyt na obliczenia. Argument ma sens długoterminowo, ale każda nowa premiera z Chin i tak wywołuje nerwowe ruchy na giełdzie.

Geopolityczny podtekst nie znika

DeepSeek trenuje swoje modele w Chinach, na sprzęcie dostępnym po sankcjach eksportowych USA. V3 podobno powstał na klastrze Nvidia H800 — procesorach z ograniczoną przepustowością pamięci, specjalnie zmodyfikowanych na potrzeby chińskiego rynku po zakazach eksportu chipów H100.

Jeśli V4 okaże się faktycznie lepszy od amerykańskiej konkurencji, a zbudowano go na gorszym sprzęcie — to argument za tym, że sankcje nie spowalniają Chin tak bardzo, jak zakładano w Waszyngtonie.

Pełne wydanie V4 i pierwsze niezależne benchmarki pokażą, czy DeepSeek rzeczywiście wykręcił wyniki lepsze od Claude’a i GPT-4o — czy to kolejny świetny chiński model, który jest dobry, ale jednak nie aż tak dobry jak twierdzi jego twórca.