OpenClaw 2026.4.24 dodaje DeepSeek V4 Flash i Pro, pełne połączenia głosowe z agentem oraz kliknięcia współrzędnymi w automatyzacji przeglądarki.

OpenClaw dodaje DeepSeek i połączenia głosowe z agentem AI

OpenClaw wypuścił update 2026.4.24 i dorzucił do swojej platformy agentowej dwa nowe modele: DeepSeek V4 Flash i DeepSeek V4 Pro. To pierwsza integracja modeli DeepSeek w tym środowisku — użytkownicy mogą teraz wybierać między nimi a wcześniej dostępnymi silnikami.

Połączenia głosowe przestają być zabawką

Do tej pory voice calls w OpenClaw trafiały do okrojonej wersji agenta — czegoś w stylu „trybu uproszczonego”, który nie miał dostępu do pełnych możliwości systemu. Wersja 2026.4.24 zmienia to: połączenia głosowe docierają teraz do pełnego agenta z całą jego konfiguracją, narzędziami i kontekstem sesji. Dla kogoś kto buduje asystenta głosowego z dostępem do zewnętrznych API — to spora różnica między prototypem a czymś, co faktycznie działa.

Browser automation: koordynaty zamiast zgadywania

Automatyzacja przeglądarki w OpenClaw dostała dwie konkretne zmiany. Pierwsza to obsługa kliknięć opartych na współrzędnych ekranu — agent może teraz trafiać w miejsca, których nie da się sensownie opisać selektorem CSS ani XPath. Przydatne przy canvasach, mapach, aplikacjach webowych renderowanych bez semantycznego HTML.

Druga zmiana to lepsze recovery — czyli co agent robi, kiedy strona się zepsuje, timeout wyrzuci błąd albo element nie pojawi się w oczekiwanym czasie. Poprzednia wersja radziła sobie z tym gorzej, co w praktyce oznaczało przerywanie długich workflow’ów i ręczne restartowanie.

Czy DeepSeek V4 to coś nowego na rynku agentów?

DeepSeek V4 Flash i Pro to modele, które od kilku tygodni przewijają się przez benchmarki — Flash celuje w szybkość i koszt, Pro w jakość przy złożonych zadaniach. Integracja z OpenClaw oznacza, że można je teraz odpalić bezpośrednio jako silnik agenta, bez stawiania własnej infrastruktury wokół API.

Dla małych zespołów i solo-deweloperów, którzy budują agenty na OpenClaw, to dostęp do tańszej alternatywy wobec GPT-4o czy Claude 3.5 Sonnet — przy porównywalnych wynikach na wielu taskach. Flash będzie szczególnie sensowny tam, gdzie liczy się latencja, np. właśnie przy połączeniach głosowych.

Fixes, które bolały

Changelogowa sekcja z poprawkami wymienia Telegram, Slack, MCP, sesje i TTS. To klasyczna lista „rzeczy, które teoretycznie działały, ale w praktyce często nie”. Problemy z integracją Telegrama i Slacka oznaczają w kontekście agentów agentów, że notyfikacje, triggery lub dwie-stronne komunikacje się wykrzaczały. MCP (Model Context Protocol) to standard zarządzania kontekstem — błędy tutaj potrafiły powodować gubienie historii rozmowy.

TTS, czyli text-to-speech, dostał własną porcję poprawek — co ma sens, bo od tej wersji voice calls działają głębiej i TTS jest w tej ścieżce bardziej eksponowany.

Skąd ta nazwa?

OpenClaw to platforma agentowa z ambicjami do bycia narzędziem-szkieletem dla deweloperów budujących własnych agentów AI. Lobster w logo nie jest przypadkowy — projekt żartobliwie nawiązuje do „pazurów” agenta, który chwyta zadania. Projekt zbiera społeczność wokół otwartego podejścia do architektury agentów, w odróżnieniu od bardziej zamkniętych rozwiązań jak OpenAI Agents czy Anthropic Computer Use.

Najbliższe tygodnie pokażą, czy DeepSeek V4 Pro w praktyce utrzyma obiecywane wyniki przy złożonych workflow’ach agentowych — pierwsze testy społeczności zaczynają się pojawiać na GitHubie projektu.”, “coverImageAlt”: “Interfejs platformy agentowej z widocznym oknem połączenia głosowego i listą modeli AI