Anthropic wstrzymuje Claude Mythos. Za mocny na publiczne wydanie

Q: Czy to pierwszy taki przypadek w branży?

Anthropic anulowało premierę modelu Claude Mythos, uznając go za zbyt potężny, by bezpiecznie udostępnić go użytkownikom.

Q: Co to oznacza dla Claude'a jako produktu?

Anthropic anulowało premierę modelu Claude Mythos, uznając go za zbyt potężny, by bezpiecznie udostępnić go użytkownikom.

Q: Czy branża powinna brać to za wzór?

Anthropic anulowało premierę modelu Claude Mythos, uznając go za zbyt potężny, by bezpiecznie udostępnić go użytkownikom.

Anthropic wstrzymało premierę Claude Mythos — modelu, który firma sama oceniła jako zbyt niebezpieczny na publiczne wydanie. Decyzja zapadła tuż przed planowanym debiutem i wywróciła do góry nogami dotychczasowy harmonogram wydań firmy.

Własny model ich przestraszył

Co musiał wykręcić benchmark, żeby zatrzymać premierę od środka? Anthropic nie podało szczegółów technicznych, ale sformułowanie „zbyt potężny, by oddać w ręce ludzi” sugeruje, że Mythos przekroczył wewnętrzne progi bezpieczeństwa, które firma stosuje przed każdym publicznym wydaniem. To nie PR — to ta sama firma, która opracowała Constitutional AI i regularnie publikuje raporty o bezpieczeństwie modeli.

Anthropic od początku pozycjonuje się jako laboratorium AI z obsesją na punkcie bezpieczeństwa. Paradoks polega na tym, że teraz ta obsesja zatrzymała ich własny produkt.

Czy to pierwszy taki przypadek w branży?

Niemal każda duża firma AI opóźniała kiedyś premierę — OpenAI przesuwało daty GPT-4, Google odkładało Barda. Jednak tamte opóźnienia wynikały z problemów technicznych lub słabych wyników. Wstrzymanie modelu z powodu zbyt dobrych wyników i zbyt dużych możliwości to inna kategoria zdarzenia.

OpenAI przez lata mówiło, że nie opublikuje GPT-2, bo był „zbyt niebezpieczny”. Ostatecznie go wrzuciło. Branża pamiętała tę historię jako przykład nadmiernej ostrożności, która okazała się niepotrzebna. Czy Anthropic powtórzy ten schemat i Mythos trafi do użytkowników kilka miesięcy później, tyle że z dłuższą listą ograniczeń — tego nie wiadomo.

Co to oznacza dla Claude’a jako produktu?

Użytkownicy Claude’a 3.5 Sonnet i Opus korzystają dziś z modeli, które Anthropic uznało za bezpieczne do szerokiego zastosowania. Mythos najwyraźniej tę granicę przekroczył. Jeśli firma traktuje tę decyzję poważnie, a nie jako chwyt marketingowy, czeka ją kilka możliwych ścieżek: dodatkowe testy i modyfikacje modelu, ograniczone udostępnienie wybranym partnerom biznesowym, albo indefinite hold — czyli zamrożenie projektu bez daty odblokowania.

Dla firm, które planowały integrować kolejną generację Claude’a w swoich produktach, ta decyzja oznacza konkretną wyrwę w roadmapie. Anthropic nie podało żadnego alternatywnego terminu.

Bezpieczeństwo jako USP — i jako blokada

Anthropic zebrało dotąd ponad 7 miliardów dolarów finansowania, a jego ostatnia wycena przekroczyła 60 miliardów. Inwestorzy kupili narrację o bezpiecznym AI jako strategicznej przewadze. Teraz ta sama narracja zatrzymuje flagowy produkt przed debiutem.

To ciekawy test dla całej strategii firmy. Bezpieczeństwo jako wyróżnik działa, dopóki nie zaczyna blokować przychodów. Mythos miał być odpowiedzią na GPT-4o i Gemini Ultra — jego brak w portfolio oznacza, że Anthropic zostaje z aktualną ofertą, podczas gdy konkurencja nie stoi w miejscu.

Czy branża powinna brać to za wzór?

Jeśli Anthropic rzeczywiście zatrzymało model, bo przekroczył ich wewnętrzne progi ryzyka — a nie dlatego, że szukało rozgłosu — to jest to jeden z niewielu momentów, kiedy firma AI zachowała się dokładnie tak, jak deklaruje w swoich raportach o bezpieczeństwie. Każda inna duża firma AI ma podobne polityki na papierze. Żadna dotąd nie wstrzymała w ten sposób własnej premiery.

Anthropic nie podało daty, kiedy — i czy w ogóle — Claude Mythos trafi do użytkowników.”, “coverImageAlt”: “Ilustracja przedstawiająca logo Claude i symbol stopu na tle kodu