Meta nauczyła AI czytać niczyją wiedzę w kodzie

Meta wdrożyła agenty AI do analizy pipeline'u danych: 4 repozytoria, 3 języki, ponad 4100 plików. Standardowe asystenty zawodziły.
Meta nauczyła AI czytać niczyją wiedzę w kodzie
TL;DR
  • Meta uruchomiła agenty AI na jednym ze swoich dużych pipeline'ów danych obejmującym ponad 4100 plików w czterech repozytoriach i trzech językach programowania.
  • Standardowe asystenty kodowania zawodziły, bo nie rozumiały tzw.
  • tribal knowledge — wiedzy ukrytej w głowach inżynierów, nie w dokumentacji.

Meta przyznaje: standardowe AI do kodu nie działa na dużą skalę

Meta skierowała agenty AI na jeden ze swoich produkcyjnych pipeline’ów danych — i szybko odkryła, że te nie nadążają. Pipeline obejmował cztery repozytoria, trzy języki programowania i ponad 4100 plików. Asystenci kodowania potrafią pisać funkcje i łapać bugi, ale przy tej skali zwyczajnie się gubią.

Problem nie leżał w samym kodzie. Leżał w tym, czego kod nie zawiera.

Czym jest tribal knowledge i dlaczego AI jej nie widzi?

Tribal knowledge to wiedza, która żyje wyłącznie w głowach inżynierów — decyzje architektoniczne, których nikt nie zapisał, konwencje, które „wszyscy znają”, obejścia dodane dwa lata temu przez kogoś, kto już nie pracuje w firmie. Żadne readme tego nie zawiera. Żaden komentarz w kodzie też nie.

Standardowy asystent AI wczytuje pliki i próbuje z nich wywnioskować intencje. Przy 4100 plikach rozsianych po czterech repozytoriach to jak próba zrozumienia firmy wyłącznie z maili z ostatnich pięciu lat — możliwe, ale niepełne i ryzykowne.

Meta odkryła to w praktyce: agenty sugerowały zmiany, które były technicznie poprawne, ale kontekstowo błędne. Nie łamały testów, ale łamały założenia, których testy nie sprawdzają.

Jak Meta to naprawiła

Inżynierowie z Meta podeszli do problemu jak do zadania ekstrakcji wiedzy, nie optymalizacji kodu. Zamiast dawać agentom surowe repozytoria, opracowali pipeline do mapowania zależności między komponentami i wyciągania ukrytych reguł.

Konkretnie — stworzyli mechanizm, który analizuje historię commitów, wzorce zmian i powiązania między plikami, żeby zbudować graf wiedzy o tym, co zależy od czego i dlaczego. Ten graf trafia do kontekstu agenta zanim ten zacznie cokolwiek pisać.

Efekt: agent wie nie tylko jak wygląda kod, ale też jakie decyzje stały za jego kształtem. To różnica między mapą ulic a mapą z informacją o tym, gdzie są korki i dlaczego.

Czy to działa tylko w Meta?

Meta operuje w skali, którą mało kto ma — ale problem jest uniwersalny. Każda firma, która działa od kilku lat i zbudowała własny, rozbudowany system, ma swoją tribal knowledge. Startupy po serii B z kilkudziesięcioma inżynierami i trzema-czterema latami długu technicznego też to znają.

Praktycznym wnioskiem z tego projektu jest to, że AI coding assistants bez kontekstu domenowego to narzędzia, które można użyć do prostych tasków. Do refaktoryzacji dużych systemów bez zasilenia ich wiedzą o systemie — nie.

Narzędzia takie jak GitHub Copilot czy Cursor mają dostęp do otwartych plików i indeksu repozytorium. Ale indeks to nie wiedza — to lista słów. Semantyczne powiązania między komponentami, historia decyzji, powody istnienia konkretnych abstrakcji — tego tam nie ma.

Trzy rzeczy, które Meta zrobiła inaczej

  • Graf zależności zamiast płaskiego kontekstu — agent dostaje strukturę, nie tylko pliki
  • Historia zmian jako sygnał intencji — commit messages i wzorce modyfikacji wchodzą do kontekstu
  • Walidacja na poziomie założeń, nie tylko składni — sprawdzanie, czy zmiana nie łamie ukrytych kontraktów między komponentami

Skala problemu mówi sama za siebie

Cztery repozytoria, trzy języki, ponad 4100 plików — i to jest jeden pipeline, nie cały system Mety. Inżynierowie przyznają wprost, że bez mapowania tribal knowledge agenty robiły błędy, których code review by nie wyłapało od razu, bo błędy były poprawne syntaktycznie i logicznie, tylko złe kontekstowo.

Meta nie opublikowała jeszcze liczbowych wyników — ile czasu zaoszczędzono, ile błędów wyeliminowano. Opis podejścia jest dostępny na blogu Engineering at Meta, ale twarde metryki jeszcze nie wyszły.”, “coverImageAlt”: “Ilustracja przedstawiająca sieć połączonych węzłów kodu analizowanych przez AI

[AI] Artykuł powstał z pomocą AI na podstawie weryfikowanych źródeł i zredagowany przez redakcję Odkrywaj.AI.