Mythos od Anthropic wyciekł do nieautoryzowanych użytkowników

Q: Czy Anthropic stracił kontrolę nad własnym modelem?

Nieznana liczba osób uzyskała dostęp do Mythosa — wewnętrznego modelu Anthropic. Firma traci kontrolę nad własnym systemem AI.

Q: Co nieautoryzowani użytkownicy mogli zrobić z dostępem?

Nieznana liczba osób uzyskała dostęp do Mythosa — wewnętrznego modelu Anthropic. Firma traci kontrolę nad własnym systemem AI.

Mała grupa nieautoryzowanych użytkowników uzyskała dostęp do Mythosa — modelu AI opracowywanego wewnętrznie przez Anthropic. Incydent wyszedł na jaw w ostatnich dniach, choć firma nie opublikowała oficjalnego oświadczenia z konkretnymi liczbami ani harmonogramem zdarzeń.

Kim jest Mythos i czemu to nie jest zwykłe narzędzie

Mythos to nie kolejna wersja Claude’a wrzucona na produkcję. Według dostępnych informacji, Anthropic używał go wewnętrznie — prawdopodobnie do badań nad bezpieczeństwem lub jako baza do testowania nowych architektur. Model nigdy nie był publicznie dostępny, co sprawia, że każdy nieautoryzowany dostęp to poważniejsza sprawa niż typowy wyciek promptów z publicznego API.

Anthropic buduje swoją markę na fundamencie bezpieczeństwa — Constitutional AI, interpretability research, cała ta otoczka firmy, która podobno „robi AI inaczej”. Wyciek do zewnętrznych użytkowników uderza dokładnie w ten wizerunek.

Czy Anthropic stracił kontrolę nad własnym modelem?

To pytanie, które zadają sobie teraz zarówno badacze bezpieczeństwa, jak i inwestorzy firmy. Amazon wpompował w Anthropic ponad 4 miliardy dolarów. Google dołożył kolejne miliardy. Obie firmy mają interes w tym, żeby Anthropic trzymał swoje systemy pod szczelną kontrolą.

Incydent z Mythosem ujawnia strukturalny problem branży: im bardziej zaawansowany model, tym więcej osób w organizacji potrzebuje do niego dostępu — inżynierowie, badacze, testerzy. Każdy dodatkowy punkt dostępu to potencjalna dziura. Anthropic zatrudnia setki specjalistów i współpracuje z zewnętrznymi kontrahentami, co geometrycznie zwiększa powierzchnię ataku.

Firma na razie milczy w kwestii wektora ataku. Nie wiadomo, czy to był błąd konfiguracji, skradzione dane uwierzytelniające, czy może celowe działanie kogoś z wewnątrz.

Branża AI ma problem z własnymi modelami

To nie pierwszy raz, gdy model AI trafia w nieodpowiednie ręce przed oficjalną premierą. W 2023 roku wagi modelu LLaMA od Meta wylądowały na 4chan kilka dni po ograniczonym udostępnieniu badaczom. Meta straciła kontrolę nad modelem, który miał trafić tylko do wybranych instytucji akademickich — i ostatecznie przyspieszyło to decyzję o pełnym open-source.

Anthropic nie planuje open-source dla Mythosa — przynajmniej nie publicznie. Firma konsekwentnie trzyma wagi swoich modeli zamknięte, argumentując to właśnie względami bezpieczeństwa. Ironicznie, te same modele okazują się podatne na wycieki innego rodzaju.

Co nieautoryzowani użytkownicy mogli zrobić z dostępem?

To zależy od tego, jak głęboki był dostęp. Samo odpytywanie modelu przez API to jedno — można sprawdzić możliwości, granice bezpieczeństwa, wrażliwość na jailbreaki. Gorzej, jeśli ktoś mógł pobrać wagi lub przejrzeć dane treningowe. W tym drugim scenariuszu Anthropic ma problem nie tylko wizerunkowy, ale i prawny — dane treningowe to aktywnie kontestowany obszar prawny w kilku jurysdykcjach.

Badacze bezpieczeństwa zwracają uwagę, że dostęp do modelu przed publicznym wydaniem daje przewagę każdemu, kto szuka w nim słabych punktów. Można spokojnie zmapować podatności zanim firma zdąży je załatać.

Anthropic musi teraz odpowiedzieć na konkretne pytania

Jak długo trwał nieautoryzowany dostęp? Ile osób go miało? Jakie dane — jeśli w ogóle — zostały wyeksportowane? Czy incydent zgłoszono odpowiednim regulatorom?

To ostatnie pytanie ma znaczenie praktyczne. EU AI Act nakłada na dostawców systemów wysokiego ryzyka obowiązki raportowania incydentów bezpieczeństwa. Jeśli Mythos kwalifikuje się do tej kategorii — a model wewnętrzny firmy rozwijającej frontier AI ma duże szanse na taką klasyfikację — Anthropic może mieć do czynienia z regulacyjnymi konsekwencjami niezależnie od tego, jak poważny był wyciek.

Na razie Anthropic nie odpalił żadnego publicznego komunikatu kryzysowego. Cisza firmy, która zbudowała markę na transparentności w kwestiach bezpieczeństwa, sama w sobie mówi całkiem sporo.”, “coverImageAlt”: “Ekran komputera z czerwonym alertem bezpieczeństwa i logo Anthropic w tle