ArXiv banuje badaczy za AI slop — bany już od teraz

Q: Czy to realny problem?

ArXiv wprowadza zakaz dla badaczy, którzy wrzucają prace pełne niezweryfikowanych halucynacji LLM, w tym zmyślonych źródeł.

Q: Czy inne platformy pójdą tym śladem?

ArXiv wprowadza zakaz dla badaczy, którzy wrzucają prace pełne niezweryfikowanych halucynacji LLM, w tym zmyślonych źródeł.

ArXiv wyciąga czerwoną kartkę

ArXiv, największa platforma preprintów naukowych na świecie, ogłosił ban dla badaczy, którzy wrzucają prace nafaszerowane niezweryfikowanymi wynikami LLM. Polityka wchodzi w życie natychmiast. Jeśli w tekście znajdą się halucynowane referencje albo meta-komentarze w stylu „jako model językowy nie mogę…” — autor dostaje bana.

Platforma nie zakazuje korzystania z AI jako takiego. Zakazuje ignorowania tego, co AI wypluło. Różnica jest spora: możesz odpalić ChatGPT do korekty stylu, ale musisz sprawdzić każde źródło, które model ci wygeneruje.

Czy to realny problem?

Tak, i to skala, która naprawdę boli. Od 2022 roku liczba preprintów z charakterystycznym śladem LLM — takim jak powtarzalne frazy, zmyślone cytaty do nieistniejących artykułów czy błędy typowe dla halucynacji modeli — wzrosła wykładniczo. Niektórzy badacze wprost przyznają, że używają modeli do generowania całych sekcji literatury, a potem nie zadają sobie trudu z weryfikacją.

Halucynowane referencje to szczególnie paskudny problem. Fikcyjne cytaty trafiają do baz danych, inni badacze próbują je odszukać, marnują czas, a fałszywe prace zyskują pozorny autorytet przez samo istnienie w przypisach. ArXiv nie jest recenzowanym journalem, ale stanowi punkt startu dla ogromnej części badań — złe preprint zatruwa studnię zanim ktokolwiek zdąży zareagować.

Jak ArXiv zamierza to egzekwować

Platforma mówi o „niezbitalnych dowodach” jako progu do bana. Konkretnie wymienione przypadki to:

Halucynowane referencje — cytaty do prac, które nie istnieją
Meta-komentarze LLM — fragmenty, gdzie model zaznaczył swoje ograniczenia i autor tego nie usunął
Inne ślady świadczące o tym, że autor nie przejrzał outputu modelu

Brak jasnego algorytmu detekcji to osobna kwestia. ArXiv nie ogłosił, czy korzysta z narzędzi pokroju GPTZero lub własnych detektorów, czy liczy na zgłoszenia społeczności. Moderacja preprintów zawsze była wąskim gardłem — platforma przyjmuje kilkaset nowych prac dziennie.

Co to zmienia dla badaczy używających AI

Nic, jeśli robisz to uczciwie. Wszystko, jeśli traktujesz LLM jak automat do produkcji tekstu bez nadzoru.

Naukowcy od dawna debatują nad granicą między dopuszczalną pomocą AI a ghostwritingiem. Korekta językowa — OK. Streszczenie własnych notatek — dyskusyjne. Generowanie sekcji Related Work bez sprawdzania każdego cytatu — właśnie to ArXiv uznaje za wystarczający powód do zablokowania konta.

Ban konta na ArXiv to nieformalna, ale bolesna kara. Platforma nie ma formalnego wpływu na kariery akademickie, ale szybkie zamieszczanie preprintów stało się standardem w wielu dziedzinach — szczególnie w fizyce, matematyce i machine learningu. Brak dostępu oznacza wypadnięcie z obiegu zanim praca trafi do recenzji.

Czy inne platformy pójdą tym śladem?

Nature i Science od miesięcy zaostrzają polityki dotyczące AI — wymagają deklaracji o użyciu modeli i przenoszą odpowiedzialność za dokładność na autorów. PubMed i IEEE mają podobne wytyczne, choć bez mechanizmu bana. ArXiv jako platforma open-access bez tradycyjnej redakcji jest w trudniejszej sytuacji — nie ma zespołu recenzentów, który wyłapie problem przed publikacją.

Ruch ArXiv jest precedensem dla nierecenzowanych repozytoriów. Kilka podobnych platform — bioRxiv, medRxiv, SSRN — nie ogłosiło jeszcze analogicznych zasad, ale obserwuje sytuację.

Na razie ArXiv nie podał liczby zbanowanych kont od momentu ogłoszenia polityki.