Gemini na Mac widzi twój ekran. Strona tego nie potrafi.
- Google udostępnił natywną aplikację Gemini na macOS, która potrafi analizować zawartość okien otwartych na pulpicie użytkownika.
- Funkcja podglądu ekranu odróżnia aplikację od wersji przeglądarkowej, która takiego dostępu nie ma.
- Aplikacja działa szybciej niż strona internetowa i nie wymaga przełączania się do przeglądarki.
Google wypuścił natywną aplikację Gemini na macOS i od razu dał jej coś, czego wersja webowa nie ma — możliwość podglądania i analizowania zawartości okien otwartych na pulpicie.
Aplikacja widzi, co masz na ekranie
To nie jest zwykły skrót do strony zapakowany w Electron. Gemini na Mac potrafi uzyskać dostęp do treści w dowolnym oknie, które mu udostępnisz — dokument w Pages, arkusz w Numbers, kod w VS Code, cokolwiek. Użytkownik wybiera okno, Gemini je skanuje i może odpowiadać na pytania dotyczące jego zawartości bez kopiowania ani wklejania.
W praktyce oznacza to, że możesz zapytać Gemini o błąd w otwartym pliku, poprosić o streszczenie dokumentu albo wygenerować odpowiedź na maila — nie ruszając się z aplikacji, w której pracujesz.
Czy to nie jest przypadkiem ryzykowne?
Dostęp do zawartości ekranu to funkcja, przy której warto zatrzymać się na chwilę. Google nie przetwarza całego pulpitu bez zgody — użytkownik sam wskazuje, które okno aplikacja może odczytać. Mechanizm przypomina udostępnianie ekranu w wideorozmowie: wybierasz konkretne okno, nie dajesz dostępu do wszystkiego.
Mimo to pytanie o prywatność pozostaje otwarte. Jakie dane trafiają do Google, jak długo są przechowywane i czy zasilają trening modeli — tego na razie Google nie komunikuje wprost przy opisie tej funkcji.
Szybkość robi różnicę
Poza dostępem do ekranu aplikacja po prostu działa sprawniej niż wersja przeglądarkowa. Odpala się skrótem klawiszowym, ładuje bez otwierania Chrome czy Safari, nie rywalizuje o pamięć RAM z kilkudziesięcioma zakładkami.
Dla kogoś, kto używa Gemini kilkanaście razy dziennie, różnica w płynności jest zauważalna. Mniej kliknięć, mniej czekania na załadowanie interfejsu, szybszy dostęp do historii rozmów.
Co już potrafią aplikacje desktopowe AI
Gemini na Mac wchodzi na rynek, gdzie Claude od Anthropic i ChatGPT od OpenAI mają już własne aplikacje desktopowe. Claude na macOS również potrafi widzieć ekran — ta funkcja pojawiła się kilka miesięcy temu i od razu stała się jednym z argumentów za płatną subskrypcją.
Microsoft Copilot jest wbudowany w Windows 11, więc osobne pobieranie odpada. Na macOS jednak żaden z gigantów nie dominuje — użytkownicy Maca mogą teraz mieć odpalonych kilka aplikacji AI jednocześnie i wybierać w zależności od zadania.
Czy Gemini nadrobi dystans do Claude’a na desktopie?
Claude wyprzedził Gemini z dostępem do ekranu o kilka miesięcy i zdążył zebrać grupę lojalnych użytkowników, którzy cenią sobie tę funkcję przy pracy z kodem i długimi dokumentami. Gemini wchodzi z podobnym zestawem możliwości, ale z jedną przewagą — integracją z ekosystemem Google: Dokumentami, Arkuszami, Gmailem.
Dla kogoś głęboko osadzonego w Google Workspace aplikacja na Mac może okazać się wygodniejsza niż alternatywy — nie dlatego, że Gemini jest lepszym modelem, ale dlatego, że kontekst z Drive czy kalendarza jest w zasięgu bez dodatkowej konfiguracji.
Na razie aplikacja jest dostępna bezpłatnie, choć część funkcji wymaga subskrypcji Gemini Advanced za 19,99 dolarów miesięcznie. Ile z możliwości podglądu ekranu działa w darmowym tierze — tego Google jeszcze nie doprecyzował w publicznej dokumentacji.