AlphaEvolve od Google pisze kod lepiej niż inżynierowie DeepMind

Q: Czy to koniec ręcznego strojenia algorytmów?

Agent AlphaEvolve oparty na Gemini samodzielnie optymalizuje algorytmy w infrastrukturze Google i odkrywa nowe wyniki matematyczne.

Q: Gdzie leży granica między narzędziem a badaczem?

Agent AlphaEvolve oparty na Gemini samodzielnie optymalizuje algorytmy w infrastrukturze Google i odkrywa nowe wyniki matematyczne.

AlphaEvolve już skraca kolejki w centrach danych Google

Google DeepMind wdrożył AlphaEvolve — agenta opartego na Gemini — bezpośrednio do produkcyjnej infrastruktury Google, gdzie optymalizuje harmonogramowanie zasobów obliczeniowych i poprawia wydajność kompilacji układów TPU. To nie demo laboratoryjne. Agent działa na żywych systemach i wykręca realne oszczędności, choć DeepMind nie podało konkretnych liczb procentowych poprawy dla wszystkich zastosowań.

Mechanizm działania AlphaEvolve różni się od standardowych agentów kodujących. Zamiast generować pojedyncze rozwiązanie, agent produkuje całą populację wariantów kodu, automatycznie je testuje i zachowuje najlepsze — proces wzorowany na ewolucji biologicznej. Gemini dostarcza tu zarówno zdolności do generowania kodu, jak i oceny jakości rozwiązań pośrednich.

Matematyka sprzed dekad ustępuje agentowi

Najbardziej spektakularny wynik AlphaEvolve leży poza infrastrukturą IT. Agent odkrył nowe algorytmy mnożenia macierzy, które poprawiają wyniki znane od ponad 50 lat — konkretnie dla macierzy 4×4 nad liczbami zespolonymi znalazł schemat wymagający mniej operacji niż dotychczas stosowane metody.

DeepMind opisuje też wyniki w problemach kombinatorycznych i geometrycznych, które matematycy bezskutecznie atakowali od lat. AlphaEvolve nie rozwiązuje tych problemów przez rozumowanie symboliczne — formuluje je jako funkcje do optymalizacji, a potem ewoluuje kod realizujący tę optymalizację. Skuteczna, ale nieelegancka metoda inżynierska zamieniona w broń naukową.

Czy to koniec ręcznego strojenia algorytmów?

Krótka odpowiedź: nie dla większości firm. AlphaEvolve wymaga precyzyjnie zdefiniowanej funkcji oceny — czymś, co można zmierzyć i porównać automatycznie. W infrastrukturze Google to czas wykonania, zużycie pamięci, liczba operacji arytmetycznych. Tam, gdzie sukces jest trudno mierzalny, agent traci przewagę.

Architektura ewolucyjna ma też koszt obliczeniowy — testowanie setek wariantów kodu w pętli wymaga zasobów, które Google ma, ale większość organizacji nie. DeepMind nie opublikowało szczegółów dotyczących wymagań sprzętowych ani tego, czy AlphaEvolve trafi do zewnętrznych użytkowników jako produkt lub API.

Porównanie z konkurencją wypada ciekawie. OpenAI’s o3 i Anthropic’s Claude 3.7 Sonnet też piszą i debugują kod, ale działają sekwencyjnie — jeden strzał lub kilka iteracji z człowiekiem w pętli. AlphaEvolve równolegle eksploruje przestrzeń rozwiązań bez nadzoru człowieka na każdym kroku. To fundamentalnie inna architektura niż asystent kodujący.

Trzy obszary, gdzie agent już działa

DeepMind wymieniło konkretne zastosowania produkcyjne:

Harmonogramowanie zadań Borg — wewnętrzny system zarządzania zasobami Google odpowiadający za miliardy zadań dziennie; AlphaEvolve zoptymalizował algorytmy przydziału zasobów
Projekt chipów TPU — agent poprawił fragmenty kodu kompilatora odpowiedzialne za mapowanie operacji na układy sprzętowe
Kompresja danych — AlphaEvolve znalazł nowe algorytmy kompresji dla wewnętrznych formatów danych Google

We wszystkich przypadkach punkt wyjścia był ten sam: istniejący, działający kod napisany przez ludzi. Agent nie startował od zera — ewoluował rozwiązania już sprawdzone w produkcji.

Gdzie leży granica między narzędziem a badaczem?

DeepMind stawia AlphaEvolve gdzieś między narzędziem inżynierskim a automatycznym badaczem naukowym. Ta dwuznaczność jest celowa — ten sam system optymalizuje cache’owanie w centrum danych i odkrywa nowe twierdzenia matematyczne.

Historycznie tego rodzaju narzędzia były specjalizowane: AlphaTensor zajmował się tylko mnożeniem macierzy, AlphaCode tylko generowaniem kodu konkursowego. AlphaEvolve to próba zbudowania ogólniejszego silnika ewolucji algorytmicznej — i pierwsze wyniki pokazują, że ta ogólność nie zabiła skuteczności w wąskich zastosowaniach.

Google nie podało daty publicznego udostępnienia AlphaEvolve ani warunków dostępu dla zewnętrznych badaczy.