Claude Opus 4.7 dostępny — koduje lepiej, widzi więcej

Q: Czy Anthropic właśnie odpalił własny program kontroli cyberbroni?

Anthropic wypuściło Claude Opus 4.7: +13% na benchmarku kodowania względem 4.6, wyższa rozdzielczość wizji i nowe zabezpieczenia cybersecurity.

Q: Gdzie siedzi Opus 4.7 w hierarchii Anthropic?

Anthropic wypuściło Claude Opus 4.7: +13% na benchmarku kodowania względem 4.6, wyższa rozdzielczość wizji i nowe zabezpieczenia cybersecurity.

Anthropic 16 kwietnia 2026 wypuściło Claude Opus 4.7 — model dostępny od razu przez API, Amazon Bedrock, Google Cloud Vertex AI i Microsoft Foundry w cenie identycznej jak poprzednik: $5/mln tokenów wejściowych i $25/mln tokenów wyjściowych.

Benchmark mówi +13%, ale liczby są bardziej szczegółowe

Na 93-zadaniowym benchmarku kodowania Opus 4.7 wykręcił o 13% lepszy wynik rozwiązywania zadań niż Opus 4.6 — w tym cztery zadania, których nie rozwiązał ani Opus 4.6, ani Sonnet 4.6. Hex raportuje, że nisko-wysiłkowy Opus 4.7 odpowiada średniemu wysiłkowi Opus 4.6. Na benchmarku agentów finansowych model zdobył 0.815 punktu w module General Finance wobec 0.767 poprzedniej wersji i tied for first z wynikiem 0.715 w sześciu modułach łącznie.

Użytkownicy early access z Devin opisują, że model „pracuje spójnie przez godziny i przebija się przez trudne problemy zamiast się poddawać” — co brzmi jak reklama, ale pokrywa się z architekturą zoptymalizowaną pod sustained reasoning w długich sesjach.

Czy Anthropic właśnie odpalił własny program kontroli cyberbroni?

To jest ciekawszy wątek niż benchmarki. Tydzień przed premierą Anthropic ogłosił Project Glasswing — raport o ryzykach AI w cybersecurity. Opus 4.7 jest pierwszym modelem, na którym firma testuje nowe mechanizmy blokowania: automatyczne wykrywanie i odrzucanie zapytań wskazujących na zakazane lub wysokiego ryzyka zastosowania ofensywne.

Co więcej, Anthropic przyznaje wprost, że podczas treningu eksperymentowali z „differentially reducing” możliwości cybernetycznych modelu — czyli celowym osłabianiem wybranych kompetencji. Nie robili tego wcześniej publicznie przy żadnym Claude. To beta dla ich docelowej procedury przed wydaniem Mythos Preview, który te blokady dostanie dopiero po zebraniu danych z real-world deploymentu Opusa 4.7.

Security researcherzy z legitymowanymi potrzebami (pen-testing, red-teaming, vulnerability research) mogą dołączyć do Cyber Verification Program — oddzielna ścieżka weryfikacji, żeby nie blokować legalnego użytku.

Wizja i kreatywność — nie tylko marketing

Model obsługuje obrazy w wyższej rozdzielczości niż 4.6. Solve Intelligence, firma budująca narzędzia do patentów life sciences, raportuje „major improvements” w czytaniu struktur chemicznych i technicznych diagramów. To konkretny use case, nie abstrakcyjna poprawa.

Anthropodic opisuje też lepszą „tasteful creativity” przy tworzeniu interfejsów, slajdów i dokumentów — co jest najsłabiej weryfikowalnym twierdzeniem w całym komunikacie, ale Replit potwierdza wyższą jakość przy analizie logów przy niższych kosztach.

Co Opus 4.7 robi inaczej niż 4.6

Weryfikuje własne outputy przed ich wysłaniem — model raportuje błędy zamiast podawać prawdopodobne-ale-błędne odpowiedzi
Odporność na “dissonant-data traps” — pułapki sprzecznych danych, w które wpadał 4.6
Pushback podczas dyskusji technicznych — kilku testerów niezależnie wymienia to jako cechę, nie bug
Lepsza latencja przy długich, wieloetapowych workflow

Gdzie siedzi Opus 4.7 w hierarchii Anthropic?

Anthropic bezpośrednio przyznaje, że Opus 4.7 jest mniej capable niż Claude Mythos Preview — model, którego release pozostaje ograniczony. Opus 4.7 to nie flagship, to solidny model produkcyjny z celowo przyciętymi możliwościami cyber i nową warstwą safety jako poligon doświadczalny.

Dostęp przez claude-opus-4-7 w Claude API od dziś.”, “coverImageAlt”: “Interfejs Claude Opus 4.7 z kodem na ekranie i wizualizacją przetwarzania obrazów