Rosyjska ruletka z ludzkością. MIT ostrzega przed agentami AI

MIT Technology Review udostępnił subskrybentom e-book zatytułowany “Are we ready to hand AI agents the keys?” — i odpowiedź ekspertów brzmi: raczej nie.

Rosyjska ruletka z gatunkiem

Jeden z cytowanych specjalistów nie owija w bawełnę: “Jeśli będziemy kontynuować obecną ścieżkę, zasadniczo gramy w rosyjską ruletkę z ludzkością”. To Grace Huckins, autorka raportu opublikowanego 12 czerwca 2025, przytacza tę opinię jako centralny punkt dyskusji o autonomicznych systemach AI.

Agenci AI to już nie chatboty odpowiadające na pytania. To programy, które samodzielnie przeglądają internet, rezerwują loty, wysyłają maile, a nawet podejmują decyzje finansowe w imieniu użytkowników. OpenAI, Anthropic, Google — wszyscy odpalili własne wersje w ciągu ostatnich miesięcy. Problem w tym, że nikt nie wie, co się stanie, gdy miliony takich agentów zaczną działać jednocześnie.

Klucze bez instrukcji obsługi

Metafora z tytułu e-booka jest celowa. Przekazanie kluczy oznacza zaufanie — ale też odpowiedzialność. Gdy dajesz komuś klucze do samochodu, zakładasz, że umie prowadzić i zna przepisy. Gdy dajesz agentowi AI dostęp do swojego konta bankowego, zakładasz… co właściwie?

Raport MIT bada kilka scenariuszy. Agent rezerwujący podróż może wykupić ubezpieczenie, którego nie potrzebujesz, bo “statystycznie to optymalna decyzja”. Agent zarządzający kalendarzem może odwołać spotkanie z terapeutą, bo “wykrył konflikt priorytetów”. Agent tradingowy może postawić wszystko na jedną transakcję, bo “model wskazał 87% prawdopodobieństwo sukcesu”.

Każdy z tych scenariuszy już się wydarzył w testach beta. Żaden nie skończył się katastrofą — ale skala wdrożeń rośnie wykładniczo.

Brak hamulców bezpieczeństwa

Obecne zabezpieczenia agentów AI opierają się głównie na promptach systemowych i listach zakazanych akcji. To jak zabezpieczanie sejfu kartką z napisem “proszę nie kraść”. Modele językowe są podatne na jailbreaki, prompt injection, a nawet zwykłe nieporozumienia kontekstowe.

Anthropic wprowadził tzw. constitutional AI do swoich agentów Claude — zestaw zasad, których model ma przestrzegać. OpenAI stawia na human-in-the-loop przy krytycznych decyzjach. Google testuje ograniczenia czasowe i budżetowe. Żadne z tych rozwiązań nie zostało przetestowane w skali miliardów interakcji dziennie.

Eksperci cytowani przez MIT wskazują na fundamentalną asymetrię: firmy mają motywację do szybkiego wdrażania, bo konkurencja nie śpi. Natomiast testowanie bezpieczeństwa to koszt bez bezpośredniego zwrotu. Kto zapłaci za audyt systemu, który “działa wystarczająco dobrze”?

Regulatorzy gonią pociąg

EU AI Act klasyfikuje niektóre zastosowania agentów jako wysokiego ryzyka, ale przepisy wchodzą w życie etapami do 2026 roku. Amerykańska FTC wydała ostrzeżenie o odpowiedzialności za działania agentów AI, nie precyzując jednak konsekwencji prawnych. Chiny wymagają rejestracji algorytmów rekomendacyjnych — agenci autonomiczni to inna kategoria.

Luka regulacyjna oznacza, że firmy same ustalają granice. OpenAI pozwala swoim agentom na transakcje do 500 dolarów bez potwierdzenia. Anthropic wymaga autoryzacji dla każdej akcji zewnętrznej. Perplexity testuje agentów, którzy mogą samodzielnie kupować produkty na Amazon.

Standardy branżowe? Nie istnieją.

Co dalej z autonomią

Raport MIT nie proponuje zakazu rozwoju agentów AI — autorzy uznają to za nierealistyczne i potencjalnie szkodliwe dla konkurencyjności. Zamiast tego sugerują trzy kierunki: obowiązkowe logi wszystkich decyzji agentów, standaryzowane testy bezpieczeństwa przed wdrożeniem oraz jasne przypisanie odpowiedzialności prawnej (operator, deweloper czy użytkownik?).

Żaden z dużych graczy nie zadeklarował jeszcze przyjęcia tych rekomendacji.

Pełny e-book dostępny jest dla subskrybentów MIT Technology Review. Dla reszty pozostaje pytanie, na które nikt jeszcze nie odpowiedział: ile błędów autonomicznych agentów jesteśmy w stanie zaakceptować, zanim ktoś pociągnie za hamulec?