Słownik AI: 15 terminów, które musisz znać

Q: Czym są halucynacje i dlaczego model kłamie z przekonaniem?

TechCrunch opublikował przewodnik po najważniejszych pojęciach AI — od LLM-ów po halucynacje. Oto co naprawdę oznaczają te słowa.

Q: Fine-tuning kontra RAG: które podejście wybrać?

TechCrunch opublikował przewodnik po najważniejszych pojęciach AI — od LLM-ów po halucynacje. Oto co naprawdę oznaczają te słowa.

Q: Czy termin „AGI" cokolwiek jeszcze znaczy?

TechCrunch opublikował przewodnik po najważniejszych pojęciach AI — od LLM-ów po halucynacje. Oto co naprawdę oznaczają te słowa.

TechCrunch wrzucił na swoje łamy kompaktowy przewodnik po terminologii AI — glossariusz, który rozkłada na czynniki pierwsze pojęcia rzucane codziennie na konferencjach, w podcastach i firmowych prezentacjach. Bez owijania w bawełnę: jeśli ktoś mówi „nasz model halucynuje” i nie wiesz co to znaczy, masz problem.

LLM to nie magia — to statystyka na sterydach

Large Language Model, czyli LLM, to fundament większości narzędzi AI, z którymi masz do czynienia na co dzień. Model uczy się przewidywać kolejny token na podstawie miliardów przykładów tekstowych. GPT-4, Claude 3.5, Gemini 1.5 — wszystkie działają na tej zasadzie. Różnią się architekturą, danymi treningowymi i tym, ile kasy ich twórcy przepalili na obliczenia.

Transformer to architektura, która umożliwiła skok jakości LLM-ów po 2017 roku. Google Research opublikował wtedy paper „Attention Is All You Need” i branża już nigdy nie wróciła do poprzednich podejść.

Czym są halucynacje i dlaczego model kłamie z przekonaniem?

Halucynacja to sytuacja, gdy model generuje informację, która brzmi pewnie i sensownie, ale jest po prostu nieprawdziwa. Model nie „wie” że kłamie — on produkuje statystycznie prawdopodobny ciąg tokenów, który akurat mija się z faktami.

To jeden z największych problemów produkcyjnych. Firma wdraża chatbota do obsługi klienta, bot zaczyna wymyślać nieistniejące produkty albo błędne ceny — i zaczyna się dramat. Retrieval-Augmented Generation (RAG) to jedno z popularnych rozwiązań: zamiast pytać model o fakty z pamięci, podajesz mu aktualne dokumenty jako kontekst.

Prompt engineering: zawód, który nikt nie przewidział

Prompt to instrukcja, którą dajesz modelowi. Prompt engineering to sztuka pisania tych instrukcji tak, żeby model wykręcił dokładnie to, czego potrzebujesz. Brzmi trywialnie, w praktyce potrafi zająć tygodnie.

Techniki jak chain-of-thought (każ modelowi „myśleć na głos” krok po kroku) potrafią podnieść jakość odpowiedzi o kilkanaście procent na standardowych benchmarkach. Few-shot prompting polega na wrzuceniu kilku przykładów wejście-wyjście zanim zadasz właściwe pytanie — model łapie wzorzec i powiela go.

Fine-tuning kontra RAG: które podejście wybrać?

Fine-tuning to doszkolenie bazowego modelu na własnych danych. Kosztuje — i to sporo, bo liczysz w GPU-godzinach. Daje za to model, który „wchłonął” twoją domenę i potrafi odpowiadać w konkretnym stylu czy formacie.

RAG jest tańszy i łatwiejszy do aktualizowania. Zmieniasz dokumenty w bazie wektorowej i model od razu operuje na nowych danych, bez kolejnego treningu. Większość enterprise’owych wdrożeń w 2024 i 2025 roku poszła właśnie tą drogą.

Baza wektorowa (vector database) to specjalny typ bazy danych, który przechowuje embeddingi — numeryczne reprezentacje tekstu. Pinecone, Weaviate, Qdrant — to najpopularniejsi gracze w tym segmencie.

Czy termin „AGI” cokolwiek jeszcze znaczy?

Artificial General Intelligence to pojęcie, które branża rozciągnęła do granic absurdu. OpenAI definiuje AGI jako system, który „przewyższa ludzi w większości ekonomicznie wartościowych zadań”. Anthropic unika tej nazwy. DeepMind używa jej ostrożnie. Sam Altman powiedział w 2024 roku, że OpenAI może osiągnąć AGI „w ciągu kilku lat” — co dla inwestorów brzmi ekscytująco, a dla badaczy bezpieczeństwa już niekoniecznie.

Inference to moment, gdy trenujesz model… nie, czekaj — to moment, gdy odpalasz gotowy model żeby wygenerował odpowiedź. Training to proces uczenia. To rozróżnienie ma znaczenie finansowe: inference skaluje się z liczbą zapytań użytkowników i generuje bieżące koszty operacyjne, training to jednorazowy (choć gigantyczny) wydatek.

Temperatura modelu decyduje o kreatywności

Temperatura to parametr kontrolujący losowość generowania. Ustawiona na 0 daje deterministyczne, powtarzalne odpowiedzi — przydatne przy kodowaniu czy ekstrakcji danych. Wyższa temperatura (0.7–1.0) sprawia, że model bardziej „ryzykuje” w doborze słów i generuje bardziej zróżnicowane, kreatywne teksty.

Context window to ilość tekstu, którą model „widzi” jednocześnie — zarówno historię rozmowy, jak i twój aktualny prompt. Gemini 1.5 Pro obsługuje okno kontekstu do 1 miliona tokenów, co odpowiada mniej więcej 750 tysiącom słów.”, “coverImageAlt”: “Ilustracja przedstawiająca ekran z terminami AI i ikonami robotów w tle