OpenClaw dodaje DeepSeek i połączenia głosowe z agentem AI
- OpenClaw wypuścił wersję 2026.4.24 z obsługą modeli DeepSeek V4 Flash i Pro jako nowych silników agenta.
- Połączenia głosowe mogą teraz docierać do pełnego agenta, a nie tylko do uproszczonego interfejsu.
- Automatyzacja przeglądarki zyskała kliknięcia oparte na współrzędnych ekranu oraz lepsze mechanizmy odzyskiwania po błędach.
OpenClaw wypuścił update 2026.4.24 i dorzucił do swojej platformy agentowej dwa nowe modele: DeepSeek V4 Flash i DeepSeek V4 Pro. To pierwsza integracja modeli DeepSeek w tym środowisku — użytkownicy mogą teraz wybierać między nimi a wcześniej dostępnymi silnikami.
Połączenia głosowe przestają być zabawką
Do tej pory voice calls w OpenClaw trafiały do okrojonej wersji agenta — czegoś w stylu „trybu uproszczonego”, który nie miał dostępu do pełnych możliwości systemu. Wersja 2026.4.24 zmienia to: połączenia głosowe docierają teraz do pełnego agenta z całą jego konfiguracją, narzędziami i kontekstem sesji. Dla kogoś kto buduje asystenta głosowego z dostępem do zewnętrznych API — to spora różnica między prototypem a czymś, co faktycznie działa.
Browser automation: koordynaty zamiast zgadywania
Automatyzacja przeglądarki w OpenClaw dostała dwie konkretne zmiany. Pierwsza to obsługa kliknięć opartych na współrzędnych ekranu — agent może teraz trafiać w miejsca, których nie da się sensownie opisać selektorem CSS ani XPath. Przydatne przy canvasach, mapach, aplikacjach webowych renderowanych bez semantycznego HTML.
Druga zmiana to lepsze recovery — czyli co agent robi, kiedy strona się zepsuje, timeout wyrzuci błąd albo element nie pojawi się w oczekiwanym czasie. Poprzednia wersja radziła sobie z tym gorzej, co w praktyce oznaczało przerywanie długich workflow’ów i ręczne restartowanie.
Czy DeepSeek V4 to coś nowego na rynku agentów?
DeepSeek V4 Flash i Pro to modele, które od kilku tygodni przewijają się przez benchmarki — Flash celuje w szybkość i koszt, Pro w jakość przy złożonych zadaniach. Integracja z OpenClaw oznacza, że można je teraz odpalić bezpośrednio jako silnik agenta, bez stawiania własnej infrastruktury wokół API.
Dla małych zespołów i solo-deweloperów, którzy budują agenty na OpenClaw, to dostęp do tańszej alternatywy wobec GPT-4o czy Claude 3.5 Sonnet — przy porównywalnych wynikach na wielu taskach. Flash będzie szczególnie sensowny tam, gdzie liczy się latencja, np. właśnie przy połączeniach głosowych.
Fixes, które bolały
Changelogowa sekcja z poprawkami wymienia Telegram, Slack, MCP, sesje i TTS. To klasyczna lista „rzeczy, które teoretycznie działały, ale w praktyce często nie”. Problemy z integracją Telegrama i Slacka oznaczają w kontekście agentów agentów, że notyfikacje, triggery lub dwie-stronne komunikacje się wykrzaczały. MCP (Model Context Protocol) to standard zarządzania kontekstem — błędy tutaj potrafiły powodować gubienie historii rozmowy.
TTS, czyli text-to-speech, dostał własną porcję poprawek — co ma sens, bo od tej wersji voice calls działają głębiej i TTS jest w tej ścieżce bardziej eksponowany.
Skąd ta nazwa?
OpenClaw to platforma agentowa z ambicjami do bycia narzędziem-szkieletem dla deweloperów budujących własnych agentów AI. Lobster w logo nie jest przypadkowy — projekt żartobliwie nawiązuje do „pazurów” agenta, który chwyta zadania. Projekt zbiera społeczność wokół otwartego podejścia do architektury agentów, w odróżnieniu od bardziej zamkniętych rozwiązań jak OpenAI Agents czy Anthropic Computer Use.
Najbliższe tygodnie pokażą, czy DeepSeek V4 Pro w praktyce utrzyma obiecywane wyniki przy złożonych workflow’ach agentowych — pierwsze testy społeczności zaczynają się pojawiać na GitHubie projektu.”, “coverImageAlt”: “Interfejs platformy agentowej z widocznym oknem połączenia głosowego i listą modeli AI