Anthropic odpalił marketplace gdzie AI handluje z AI

Anthropic stworzył eksperymentalny rynek, na którym agenci AI kupowali i sprzedawali prawdziwe towary za prawdziwe pieniądze.
Ilustracja dwóch robotów handlujących towarami na cyfrowym rynku
TL;DR
  • Anthropic przeprowadził eksperyment, w którym agenci AI działali jednocześnie jako kupujący i sprzedający na symulowanym rynku ogłoszeniowym.
  • Transakcje dotyczyły prawdziwych towarów i odbywały się za prawdziwe pieniądze, nie w środowisku czysto symulowanym.
  • Badanie sprawdzało, czy autonomiczne agenty potrafią negocjować i finalizować umowy bez udziału ludzi.

Anthropic stworzył eksperymentalny rynek ogłoszeniowy, na którym agenci AI reprezentowali zarówno kupujących, jak i sprzedających — i dobijali realnych transakcji za realne pieniądze na realne towary.

Jak działał ten eksperyment?

Setup był prosty, ale konsekwencje tego, co z niego wynikło, już niekoniecznie. Agenty po jednej stronie miały coś do sprzedania, agenty po drugiej — budżet i cel zakupowy. Żadnych ludzi w pętli podczas samej transakcji. Cały przepływ — od ogłoszenia, przez negocjacje, po finalizację — obsługiwały modele samodzielnie.

To nie był kolejny benchmark w sterylnym środowisku. Anthropic celowo użył prawdziwych towarów i prawdziwych środków, żeby sprawdzić, czy agenty potrafią operować w warunkach z realną stawką, a nie tylko w piaskownicy z fikcyjnymi punktami.

Dlaczego to więcej niż ciekawostka?

Komercja agent-do-agenta to jeden z tych scenariuszy, o których branża mówi od lat, ale mało kto próbował zbudować choćby kontrolowany dowód słuszności koncepcji. Anthropic właśnie to zrobił.

Agenty w roli sprzedawców musiały wycenić towar, sformułować ofertę i odpowiadać na kontrpropozycje. Agenty kupujące działały z określonym budżetem i instrukcjami — coś w stylu briefu zakupowego. Kto negocjował lepiej? To akurat Anthropic jeszcze nie ujawnił w szczegółach.

Za każdym razem, gdy myślimy o agentach jako o asystentach pomagających ludziom, ten eksperyment przesuwa suwak: agenty jako samodzielne podmioty gospodarcze. To różnica jakościowa, nie ilościowa.

Pieniądze się zgadzają, ale kto podpisuje umowę?

Najciekawszy problem, który ten eksperyment odsłania, to nie technologia, tylko odpowiedzialność prawna i finansowa. Jeśli agent AI kupuje coś za prawdziwe pieniądze — kto jest stroną umowy? Kto odpowiada za reklamację? Kto płaci podatek?

Anthropicowi udało się zreplikować mechanikę handlu. Regulatorzy jeszcze nie zreplikowali mechaniki nadzoru nad takimi transakcjami. EU AI Act w obecnej wersji nie definiuje wprost sytuacji, w której obie strony kontraktu to systemy autonomiczne działające bez bezpośredniej instrukcji człowieka w momencie zawarcia umowy.

W Stanach sytuacja jest jeszcze bardziej rozmyta — brak federalnych ram dla autonomicznych agentów handlowych sprawia, że każda taka transakcja to potencjalnie pole minowe dla prawników obu firm, które takie agenty wdrożą produkcyjnie.

Model Claude jako negocjator — na ile to skalowalne?

Anthropic używał do eksperymentu własnych modeli z rodziny Claude. To logiczne — mają pełen wgląd w to, jak model podejmuje decyzje, mogą analizować łańcuch rozumowania i wyłapywać momenty, w których agent zachował się nieoczekiwanie.

Skalowanie tego do środowiska produkcyjnego to inne zwierzę. W kontrolowanym eksperymencie Anthropic może zatrzymać transakcję w dowolnym momencie. Na żywym rynku — z tysiącami agentów kupujących i sprzedających jednocześnie — interwencja człowieka staje się fizycznie niemożliwa w czasie rzeczywistym.

OpenAI buduje własną infrastrukturę agentową przez Responses API i narzędzia do orkiestracji. Google testuje agenty w Workspace. Żaden z tych graczy nie pokazał jeszcze publicznie eksperymentu z prawdziwymi pieniędzmi po obu stronach transakcji — Anthropic właśnie zgarnął pierwszeństwo w tej narracji.

Czy agenty będą wkrótce podpisywać kontrakty za firmy?

Kilka firm z sektora enterprise już testuje agenty do automatycznego zamawiania surowców, odnawiania subskrypcji SaaS czy negocjowania stawek z dostawcami. Zazwyczaj jednak człowiek zatwierdza każdą transakcję powyżej określonego progu kwotowego.

Eksperyment Anthropica sugeruje, że próg ten można obniżyć — albo całkowicie wyeliminować dla określonych kategorii transakcji. Ile firma jest gotowa zaryzykować, delegując finalizację kontraktu modelowi, który nie może podpisać NDA ani stanąć przed sądem?

Anthropicowi należy przyznać, że zamiast pisać whitepapers o agent-to-agent economy, po prostu to uruchomili i sprawdzili co się stanie.

[AI] Artykuł powstał z pomocą AI na podstawie weryfikowanych źródeł i zredagowany przez redakcję Odkrywaj.AI.