Meta nagrywa kliknięcia pracowników. Dane idą do AI.

Q: Czy pracownicy wiedzą, że są danymi treningowymi?

Meta wdrożyła narzędzie rejestrujące ruchy myszy i kliknięcia klawiszy swoich pracowników — dane trafiają prosto do trenowania modeli AI.

Q: Czy to zadziała jako strategia pozyskiwania danych?

Meta wdrożyła narzędzie rejestrujące ruchy myszy i kliknięcia klawiszy swoich pracowników — dane trafiają prosto do trenowania modeli AI.

Meta odpalila wewnętrzne narzędzie, które nagrywa każde kliknięcie myszy i naciśnięcie klawisza swoich pracowników, a zebrane dane konwertuje na materiał treningowy dla modeli AI.

Jak to działa technicznie

Narzędzie rejestruje niskopoziomowe zdarzenia systemowe — ruchy kursora, kliknięcia przycisków, sekwencje naciśnięć klawiszy — i przetwarza je w ustrukturyzowane dane behawioralne. To nie logi aplikacji. To pełny zapis tego, jak człowiek obsługuje komputer przez osiem godzin dziennie.

Dla modeli AI, szczególnie tych trenowanych pod kątem automatyzacji zadań i agentów komputerowych, taki materiał ma inną wartość niż tekst czy obrazy. Pokazuje sekwencje decyzji: gdzie użytkownik patrzy, zanim kliknie, jak nawiguje między oknami, jakie skróty klawiszowe stosuje przy określonych zadaniach.

Czy pracownicy wiedzą, że są danymi treningowymi?

Meta oficjalnie przyznała się do istnienia tego narzędzia — to odróżnia tę sytuację od cichego monitoringu. Firma nie ujawniła jednak, czy pracownicy wyrazili formalną zgodę, czy poinformowanie ich traktuje jako wystarczający warunek legalności zbierania danych.

To istotna różnica prawna, szczególnie dla pracowników objętych GDPR — czyli zatrudnionych w europejskich biurach Mety. Zgoda wymuszona przez pracodawcę formalnie nie spełnia wymogów rozporządzenia, bo nie jest dobrowolna. Europejskie organy ochrony danych już wielokrotnie nakładały kary na firmy, które myliły “poinformowanie” ze “zgodą”.

W USA prawo jest znacznie łagodniejsze wobec pracodawców monitorujących pracowników na służbowym sprzęcie. Tam Meta prawdopodobnie porusza się po bezpiecznym gruncie.

Do czego Meta chce użyć tych danych

Meta intensywnie rozwija agentów AI zdolnych do obsługi komputera — klikania, wypełniania formularzy, nawigowania po interfejsach. Żeby taki agent działał wiarygodnie, musi być trenowany na danych pokazujących, jak ludzie faktycznie wykonują te czynności.

Syntetyczne dane albo dane zbierane w kontrolowanych środowiskach laboratoryjnych nie oddają chaosu prawdziwej pracy: przełączania między dziesiątkami zakładek, poprawiania błędów, korzystania z wewnętrznych narzędzi niedostępnych publicznie. Pracownicy Mety używają właśnie takich narzędzi i wykonują właśnie takie zadania.

Apple, Google i Microsoft zbierają dane o sposobie używania swoich systemów operacyjnych od lat — ale w trybie opt-in i w zanonimizowanej formie. Meta idzie krok dalej, zbierając dane od konkretnych, zidentyfikowanych pracowników w środowisku korporacyjnym.

Precedens, który może boleć

Jeśli Meta wykręci dobre benchmarki na modelach wytrenowanych w ten sposób, inne firmy zaczną się zastanawiać, czy nie zrobić tego samego. Amazonu, Google’a czy Microsoft mają dziesiątki tysięcy pracowników klikających codziennie w wewnętrzne systemy — to kopalnia danych dla agentów AI.

Związki zawodowe w branży tech — tam gdzie istnieją — oraz organizacje zajmujące się prawami pracowniczymi już sygnalizują, że taki model zbierania danych wymaga regulacji. Pracownik nie jest użytkownikiem, który może odinstalować aplikację zbierającą dane. Pracownik jest zależny od pracodawcy.

Pytanie, które zadają sobie prawnicy i regulatorzy: czy dane wytworzone przez pracownika podczas wykonywania obowiązków służbowych automatycznie należą do pracodawcy? Odpowiedź różni się w zależności od jurysdykcji i od tego, co dokładnie jest w umowie o pracę.

Czy to zadziała jako strategia pozyskiwania danych?

Meta zatrudnia około 70 000 osób. Nawet jeśli tylko część z nich pracuje przy komputerach w sposób relevantny dla trenowania agentów AI, to i tak potencjalnie miliony godzin nagrań miesięcznie.

Dla porównania: jeden z największych publicznych zbiorów danych do trenowania agentów komputerowych — Mind2Web — zawiera dane z kilku tysięcy sesji. Meta jednym narzędziem wewnętrznym może wygenerować więcej danych w tydzień niż cała dotychczasowa literatura naukowa w tej dziedzinie.

Czy regulatorzy pozwolą Mecie spokojnie korzystać z tak zebranych danych w produktach komercyjnych — to już inna historia.