Kiedy w listopadzie 2022 świat ujrzał ChatGPT-3, reakcje były mieszanką fascynacji i… zaskoczenia. Fascynacji – bo AI zaczęło mówić ludzkim językiem. Zaskoczenia – bo Google, firma przez lata dominująca w badaniach nad sztuczną inteligencją, została nagle wyprzedzona przez stosunkowo młodą firmę: OpenAI. Przez wiele miesięcy Google sprawiało wrażenie, jakby nie wiedziało, co zrobić. Ale dziś? Dziś Google wraca na podium. I to z przytupem.
W tym artykule opowiem Ci o trzech rozwiązaniach od Google, które robią naprawdę dobrą robotę: Gemini, Notebook LM oraz Google AI Studio. Pokażę Ci ich praktyczne zastosowania, podzielę się moimi refleksjami, a także wskażę, w czym są lepsze (a w czym gorsze) od ChatGPT i innych narzędzi.
Spis treści
Czas gdy Google było w tyle.
Zanim jednak przejdziemy do konkretów, trochę kontekstu. Jeszcze w 2016 roku Google dominowało w świecie AI: wprowadzenie neuronowego tłumaczenia w Google Translate czy premiera Asystenta Google pokazały, że firma ma know-how, by tworzyć rzeczy wielkie. Ale potem coś się zacięło.
Pierwszą odpowiedzią Google na ChatGPT był Bard. Niestety – narzędzie było niespójne, mniej trafne i wyraźnie gorsze niż konkurencja. Potem pojawił się Gemini, który przez wiele miesięcy miał opinię „tego gorszego czata”. Google – dawny lider – znalazł się w defensywie.
Ale jak to w życiu – kryzys może być początkiem odrodzenia.

Rok 2025: kiedy Google zaczęło robić porządne AI
Choć Google już od początku 2024 roku sygnalizowało swój potencjał w dziedzinie AI, to prawdziwe efekty tej pracy zaczęliśmy dostrzegać na początku roku 2025. Kulminacją tych zmian jest bez wątpienia zaawansowane narzędzie do głębokiej analizy, Deep Research od Google.
Jednak już wcześniej, w tym przełomowym okresie 2024/2025, Google zaczęło prezentować produkty, które nie tylko dorównywały konkurencji, ale w wielu aspektach ją przewyższały. Co stało za tą transformacją?
Przede wszystkim, kluczowa okazała się integracja. Połączenie mocy Gemini i innych narzędzi Google AI z powszechnie używanymi usługami jak Google Drive, YouTube, Mapy, Gmail czy Dokumenty stworzyło synergię trudną do skopiowania.
Po drugie, Google zrezygnowało z bezustannej pogoni za modelem ChatGPT i skupiło się na innowacjach, wytyczając własne ścieżki. To właśnie w tym duchu narodził się Notebook LM – narzędzie o unikalnym charakterze, odmiennym od tradycyjnych chatbotów.
Po trzecie, nie można pominąć dynamicznego rozwoju samych modeli tekstowych Google. Modele takie jak Gemini Pro, a zwłaszcza najnowsze iteracje, regularnie osiągają czołowe pozycje w branżowych benchmarkach, udowadniając swoją zaawansowaną zdolność do rozumienia języka, generowania tekstu, kodowania i rozwiązywania złożonych problemów. Ten ciągły postęp w architekturze i możliwościach modeli stanowi fundament dla wszystkich innowacyjnych aplikacji Google AI.
A po czwarte, nie można pominąć udostępnienia Google AI Studio, darmowej (w ramach limitów) platformy deweloperskiej, która otworzyła drzwi do eksperymentowania i tworzenia spersonalizowanych rozwiązań AI.
W tym kontekście, Notebook LM, który publicznie zadebiutował w grudniu 2023 roku, stanowi jeden z pierwszych, wyrazistych przykładów tej nowej strategii Google, polegającej na integracji, poszukiwaniu unikalnych rozwiązań AI opartych na coraz potężniejszych modelach tekstowych, co zaczęło przynosić tak obiecujące rezultaty na przełomie 2024 i 2025 roku.
Notebook LM: asystent do notatek i researchu, którego potrzebowaliśmy
Na pierwszy rzut oka Notebook LM to po prostu „czat do notatek”. Ale im dłużej z niego korzystasz, tym bardziej dostrzegasz jego unikalność.
Jak działa Notebook LM?
Wrzucasz źródła: mogą to być dokumenty Google Docs, PDF-y, linki do stron internetowych, teksty, a nawet filmy z YouTube (pod warunkiem, że mają napisy). Do jednego projektu możesz dodać aż 50 różnych źródeł.
Potem zadajesz pytania – i rozmawiasz nie z „czatem”, tylko z własnymi notatkami. Co ważne, możesz sterować tym, z których źródeł odpowiedź ma być wygenerowana. Chcesz, by AI odpowiedziało tylko na podstawie dwóch dokumentów z pięćdziesięciu? Klik – gotowe.

Wygodne udostępnianie linków
Dużą zaletą Notebook LM jest możliwość dodania linku do strony internetowej jako źródła. Dzięki temu nie musisz kopiować całej treści ręcznie — wystarczy wkleić adres, a model automatycznie pobierze zawartość strony (o ile jest publiczna i poprawnie sformatowana). To znacznie przyspiesza research i pozwala błyskawicznie analizować artykuły, wpisy blogowe czy dokumentacje online.
Linki do Youtube
Jeszcze większym ułatwieniem jest możliwość dodania linku do filmu na YouTube. Jeśli nagranie ma włączone napisy (automatyczne lub własne), Notebook LM potrafi pobrać transkrypcję i wykorzystać ją jako źródło. Dzięki temu możesz analizować wykłady, prezentacje czy tutoriale bez potrzeby ręcznego przepisywania — wystarczy wkleić link, a model zrobi resztę. To ogromna oszczędność czasu przy pracy z materiałami wideo.
Funkcja podcastu
To perełka. Na podstawie Twoich notatek, Notebook LM może stworzyć… podcast. Głosowy przegląd treści, które sam zebrałeś. Nie jest to narzędzie tworzące nagrania warte udostępniania na spotify czy na youtube, ale wystarczy, by iść na spacer czy sprzątać mieszkanie i jednocześnie uczyć się nowych rzeczy.
Pewną alternatywą dla Notebook LM może być w tej kwestii aplikacja Eleven Labs, która dobrze sobie radzi w czytaniu tekstu na głos. Do dyspozycji mamy tam np. głos Piotra Fronczewskiego. Rozwiązanie to jest lepsze, jeśli zależy nam na przesłuchaniu oryginalnego tekstu, a nie na podcaście.
Mapy myśli w notebook LM
Notebook LM oferuje szereg pomocnych funkcji, które usprawniają pracę z informacją. Mapy myśli pozwalają szybko zwizualizować strukturę tematu, co świetnie sprawdza się przy planowaniu projektów czy nauce. Notebook LM tworzy dużą mapę, z rozwijanymi elementami. Kliknięcie dany temat otwiera nam wątek tekstowy, w którym dane pojęcie jest wyjaśniane.
Wadą jest brak możliwości edycji tej mapki. Eksport jest możliwy jedynie w postaci pliku PNG.
Do tworzenia map myśli opartych na AI dużo lepsze są narzędzia takie jak Mapify, czy Whimsical, Natomiast jeśli zależy nam na pełnym wykorzystaniu potencjału map myśli, nadal niezastąpiony jest papier i ołówek, a w przypadku produktów cyfrowych – programy graficzne, w którym mamy pełną kontrolą nad ukłądem, np. Canva, Draw.io, Click up.
Pomimo tych ograniczeń, funkcja map myśli w Notebook LM, jest naprawdę sporą pomocą przy researchu, bo jest dostępna od razu, w środowisku w którym mamy więcej źródeł i notatek.

Domyślne instrukcje tekstowe
Streszczenia automatycznie wyciągają kluczowe wnioski z dłuższych tekstów – idealne do szybkiego przeglądu treści. Oś czasu pozwala uporządkować wydarzenia chronologicznie, co jest przydatne np. przy analizie procesów historycznych czy przebiegu projektu. FAQ generuje pytania i odpowiedzi na podstawie treści źródłowej – to świetny punkt wyjścia np. do artykułu lub prezentacji. Wszystkie te informacje można łatwo zapisywać jako notatki jednym kliknięciem, dzięki czemu nie trzeba kopiować odpowiedzi ręcznie. Taki zapis można potem przeglądać osobno, bez szukania w całej konwersacji. Całość sprawia, że Notebook LM jest nie tylko AI-czatem, ale prawdziwym asystentem wiedzy.
Wady Notebooka LM
Nie możesz zapisać całej konwersacji – tylko wybrane odpowiedzi. To bywa irytujące, ale zmusza też do aktywnego wyboru, co chcesz zachować. Można to potraktować jako celowe działanie, nie błąd. Nie da się tez wgrywać dokumentów Word – choć nie jest to co prawda zbyt duży problem w praktyce.

Funkcja notebook LM w płatnym chat gpt
W ChatGPT (Plus) możesz korzystać z funkcji projektów, które częściowo przypominają Notebook LM. Umożliwiają one dodanie plików (PDF, DOCX, TXT) do projektu i prowadzenie wielu czatów w jego ramach – model zna zawartość tych plików i może się do nich odnosić. W przeciwieństwie do Notebook LM nie da się jednak wybrać, które źródła mają być aktywne przy danym pytaniu. ChatGPT nie oferuje też automatycznego streszczania, tworzenia map myśli, osi czasu ani podcastów. Nie ma funkcji zapisywania odpowiedzi jako notatek – trzeba to robić ręcznie. Notebook LM daje więcej narzędzi do organizacji wiedzy, ChatGPT lepiej sprawdza się przy pisaniu dłuższych, dopracowanych tekstów.
Google AI Studio: nie musisz być deweloperem żeby z niego korzystać.
Google AI Studio to coś jak Playground od OpenAI – tylko darmowe (przynajmniej w ograniczonym zakresie). Co oferuje?
Czym jest api?
API (czyli Application Programming Interface) to sposób, w jaki różne programy mogą się ze sobą porozumiewać. Można to porównać do kelnera w restauracji – Ty (czyli aplikacja) składasz zamówienie, kelner (API) przekazuje je do kuchni (innego programu), a potem przynosi gotowe danie. Dzięki API programy mogą wymieniać się danymi i współpracować, nawet jeśli zostały stworzone przez różnych twórców. Działa to w tle, a użytkownik widzi po prostu, że wszystko „magicznie” działa razem.
Za pomocą API można np. podłączyć program księgowy do programu od zarządzania. Można też łączyć sztuczną inteligencje z innymi aplikacjami, np. chatami obsługi klienta.
Możesz zbudować własną aplikację, która rozmawia z użytkownikami przez Gemini. Albo podłączyć model językowy do innego narzędzia, np. systemu rezerwacji, formularza kontaktowego czy nawet własnej strony.
To rozwiązanie dla bardziej technicznych użytkowników – ale też dla tych, którzy lubią się uczyć i eksperymentować.
Główny cel Google AI studio
Google AI Studio zostało stworzone głównie do testowania modelu językowego przed jego wdrożeniem, np. po to, by sprawdzić, czy dobrze opisuje Twoją firmę i nie „zmyśla” na jej temat, oraz czy odpowiednio prowadzi rozmowę, tak żeby użytkownicy nie mogli za jego pomocą np. pisać artykułów czy śmieszkować w inny sposób. Studio deweloperskie pozwala też analizować, ile kosztują konkretne odpowiedzi – co jest ważne przy integracji z własną aplikacją. Ale ponieważ Google AI Studio jest przy wielu zastosowaniach bezpłatne (w przeciwieństwie do płatnego Playground od OpenAI), a do tego bardzo proste w obsłudze, można go też używać jak zwykłego chatbota – jako lekką, wygodną alternatywę dla ChatGPT czy Gemini.
Jedynym zauważalnym ograniczeniem jest długość pojedynczej konwersacji, przy czym milion tokenów pozwala stworzyć naprawde dużą
Transkrypcje i przetwarzanie audio
Możesz wrzucać nagrania audio i wideo – i AI przetworzy je na tekst. Przy filmach powyżej godziny trzeba je dzielić, ale podcasty 30–60 minutowe przechodzą gładko.
Szybki workflow:
- nagrywasz notatki głosowe na telefonie,
- wrzucasz je na Google Drive,
- importujesz do AI Studio,
- masz gotową transkrypcję, którą możesz edytować, streszczać, albo wysłać do Gemini/ChatGPT do dalszego przetwarzania.

Inne sposoby „wrzucania głosu do AI”
Wiele narzędzi, w tym Chat GPT, pozwala w jakiś sposób rozmawiać z Chatem. Natomiast większość z nich nie umożliwia tworzenia transkrypcji nagrania, co według mnie jest kluczową funkcją jeśli chodzi o przetwarzanie głosu.
Rozwiązaniami opartymi o sztuczną inteligencję, których celem jest przetwarzanie głosu, jest np. Firefly notes – wspaniała aplikacja, która tworzy transkrypcje, oraz podsumowania spotkań, możemy ją łatwo zintegrować z np. Google Meet. Jeśli chcemy po prostu dyktować tekst – możemy zrobić spotkanie tylko dla siebie. Apka Firefly notes jest użyteczna również w bezpłatnej wersji.
Inne rozwiązanie to Voice notes, dedykowane rozwiązanie do robienia notatek głosowych, natomiast jest ono płatne i kosztuje ono 13 dolarów miesięcznie.
Budowa programu Google Ai studio.
U góry wątku możemy ustawić nad instrukcję do danej konwersacji. Pasek po lewej stronie
stronie działa tak samo jak w Chat GPT czy innych modelach, i daje nam on dostęp do historii konwersacji, oraz do dodatkowych funkcji:
- Stream – umożliwia rozmowę z google ai studio, możemy mu też udostępnić ekran
- Video Gen – umożliwia generowanie krótkich, ośmiosekundowych filmów (odpowiednik Sora ai)
- Starter apps – zbiór kilkunastu prostych aplikacji, np. programu do planowania podróży, narzędzia do tworzenia fiszek, czy symulatora Windowsa 95.

Pasek po prawej stronie jest mniej intuicyjny, jest on typowo deweloperskim narzędziem. Możemy w nim wybrać model używany w odpowiedziach (to jeszcze jest dla każdego oczywiste). Niżej mamy licznik zużytych Tokenów, jest to przydatne gdy chcemy wiedzieć ile dana odpowiedź kosztuje, pokazuje to nam mniej więcej ile możemy zadać pytań w danym wątku. Dalej mamy temperaturę, która w dużym skrócie jest poziomem kreatywności.
Inne ustawienia mają zastosowanie typowo przy tworzeniu API, można np. ustawić kiedy model ma się automatycznie zatrzymać, co ma uchronić nas przed większymi wydatkami spowodowanymi przez działania użytkowników.
Generator wideo w VEO 2

Dość użyteczny generator filmów, należy pamiętać żeby zapisać stworzony wideo, ponieważ nie są one automatycznie zapisywane.
Starter apps – twórz własne aplikacje w Google ai studio
Google Ai studio umożliwia tworzenie własnych aplikacji. Możemy tworzyć je od zera, natomiast google udostępnia nam gotowe wersje działających aplikacji, mających dostęp do sztucznej inteligencji, które możemy modyfikować.

Do wyboru mamy np. aplikacje tworzącą fiszki, symulator Windowsa 95, albo aplikacje do planowania podróży.

Gemini: czat, który dogonił konkurencję (a czasem ją wyprzedza)
Długo czekałem, by móc to powiedzieć: Gemini jest w końcu dobre.
I choć początki były słabe (naprawdę słabe), dziś mamy narzędzie, które działa szybko, ma dostęp do świeżych danych i jest głęboko zintegrowane z Googlem.
Funkcja Deep Research
W porównaniu do starszej wersji, nowy Deep Search w Google Gemini to duży krok naprzód. Wcześniej funkcja była szybka, ale dość powierzchowna – przypominała bardziej klasyczne wyszukiwanie z dodatkiem kilku linków, bez efektu „wow”. Teraz Deep Search tworzy przemyślany plan działania, (który możemy modyfikować przed uruchomieniem funkcji) zbiera informacje z wielu źródeł i buduje spójne, dłuższe odpowiedzi (nawet na kilka tysięcy słów). Co ważne – nowa wersja lepiej filtruje treści, rzadziej myli fakty i częściej podaje konkretne źródła. Starsza wersja była szybka, ale płytka; nowa – nadal szybka, ale znacznie głębsza i bardziej użyteczna. To sprawia, że dziś Gemini deep search jest w wielu przypadkach lepszy niż Grook, a czasem może on konkurować z rozwiązaniami typu ChatGPT deep search czy Perplexity.

Wersja od OpenAI nadal wypada lepiej, ale Google nadrobiło zaległości i jest to już naprawdę potężne narzędzie. A dla użytkownika, który nie potrzebuje 30-minutowego researchu naukowego – Gemini jest wystarczające.

Kolejna zaleta to możliwość generowania krótkiego, parominutowego podcastu na dany temat, oraz możliwość szybkiego eksportu tekstu do dokumentów google. Krótki podcast jest dobrym uzupełnieniem notebooka LM, który domyślnie tworzy nagranie mające kilkadziesiąt minut.

https://g.co/gemini/share/04428f5831f1
Funkcja Audio overview działa nie tylko w przypadku Deep Searchu, możemy jej używać do analizowania dowolnych dokumentów, w tym plików Word.
Research Youtubowy za pomocą Gemini Deep Search
Youtube jest druga największą wyszukiwarką treści (zaraz po Google). Wielu ludzi, gdy szuka odpowiedzi na jakieś pytanie, albo szuka poradnika, używa do tego youtube. Natomiast sama wyszukiwarka w Youtube ostatnio się pogorszyła, Google dodaje do wyników wyszukiwania treści zupełnie nie związane z wyszukiwanym hasłem, a wynikające z historii oglądania.
Problem ten można rozwiązać, używając Gemini do szukania treści na youtube. Można w ten sposób odkrywać kanały, oraz szukać konkretnych wypowiedzi danych osób (funkcjonalność podobna do Groka, gdy zależy nam na przeszukaniu Twittera).


Integracja z YouTube, Mapami i Dyskiem
Tutaj Google miażdży konkurencję. Masz konto Google? Masz dokumenty na Dysku? Masz filmy z napisami? Gemini to wszystko widzi. Możesz analizować treści z YouTube, przeszukiwać własne pliki, a nawet… korzystać z map google.
Na ten moment działa to jedynie w modelu 2.0 Flash, moel deep Search nie ma możliwości tworzenia map.
Gemini i Mapy Google
Możesz pytać o miejsca na podstawie konkretnych kryteriów. Przykład:
- Szukasz restauracji z placem zabaw w pobliżu?
- Chcesz zaplanować trasę na weekend z dziećmi?
- Potrzebujesz kawiarni blisko parku?
Gemini Flash wyznaczy trasę, doda pinezki, opisze miejsca, a nawet podpowie godziny otwarcia. Tego nie zrobi ChatGPT – nawet z wtyczkami.

Customowe modele
W Chat GPT do tworzenia własnych customowych modeli potrzebujemy płatnej wersji, w Gemini mamy do tego dostęp bezpłatnie.

Google Gemini Canvas – Kanwa która jest użyteczna
Uważam używania AI nie tylko do tworzenia tekstu, ale również do edytowania tekstu który już powstał (ręcznie, lub za pomocą sztucznej inteligencji), ma duży potencjał. Dlatego, gdy tylko ta funkcja została dodana w Chat GPT, od razu ją wypróbowałem i … potem już właściwie nigdy jej nie użyłem. Kanwa a Chat gpt ma ograniczoną długość (maks 1000 słów), i w połączeniu z wolnym działaniem, i innymi ograniczeniami tego wątku, nie ma ona ona praktycznie sensu.
Inaczej jest w przypadku Canvas w Google Gemini. W tym przypadku otrzymujemy wygodny edytor tekstu, w którym możemy dodawać nagłówki, pogrubiać, dodawać listy (bądź prosić AI żeby zrobiło to za nas). Taki tekst może mieć długość nawet do 2000 słów (jeśli stosujemy parę promtów), choć dość trudno jest uzyskać dłuższe teksty. Możemy natomiast do tego roboczego dokumentu wkleić więcej tekstu, co jest wygodne gdy korzystamy z wielu kanw w ramach jednego wątku.
Co najważniejsze, taki tekst możemy wyeksportować do dokumentów Google, zachowując całe formatowanie.

Generowanie obrazków w google Gemini
Tworzenie grafik w Google Gemini jest na dość dobrym poziomie, grafiki powstają stosunkowo szybko, są dość dobrej jakości (realizm, brak błędów), natomiast Chat GPT jest w tej kwestii dużo lepszy. W Google Gemini musimy dokładniej opisać to czego chcemy, Chat GPT lepiej nas rozumie, dodatkowo w narzędziu od Open AI możemy zmieniać proporcje, i edytować grafiki, w Google Gemini nie jest to możliwe.
Do edycji grafik można stosować Google AI studio, które umożliwia modyfikacje wgrywanych zdjęć.

Google Labs i eksperymenty
Warto jeszcze wspomnieć o Google Labs – miejscu, gdzie Google testuje nowe funkcje AI. To tam pojawił się pierwszy Notebook LM, zanim stał się produktem publicznym.
Dziś znajdziesz tam m.in.:
- kursy językowe z AI,
- generatory treści,
- eksperymentalne pomysły na współpracę AI i użytkownika.
Można się zapisać na listę oczekujących albo od razu testować. Dla geeków i ciekawskich – raj.

Google vs. OpenAI: kto wygrywa?
Nie ma jednej odpowiedzi. Obie firmy idą różnymi drogami:
Cecha | OpenAI | |
---|---|---|
Szybkość działania | ✅ bardzo szybkie | ❌ wolniejsze (szczególnie w trybie browsing) |
Dostęp do danych | ✅ YouTube, Drive, Mapy | ⚠️ ograniczony, ale z swobodnym dostępem do internetu |
Pisanie długich tekstów | ⚠️ dobre, ale nie idealne | ✅ lepsze |
Tworzenie podcastów | ✅ (Notebook LM) | ❌ brak |
Cena | ✅ AI Studio za darmo | ❌ Playground płatny |
Deep Search | ⚠️ dobry, ale nie idealne | ✅ Potężne narzędzie |
Generowanie grafik | ⚠️ akceptowalne | ✅ Tworzenie i edycja na wysokim poziomie |
Jakoś tekstu | ✅ Dobra | ✅ Na wysokim poziomie |
Pamięć | ❌ Brak | ✅ Rozwinięta pamięć pomiędzy wątkami |
Porównania ilości funkcji nie da się zrobić w tabelce, ponieważ Google i Open AI przyjęło rożne strategie. Open AI ma wszystko praktycznie w jednym narzędziu (Chat GPT), i w nim jest wiele funkcji, takich jak np. projekty, generowanie zdjęć, generowanie filmów, własne modele, itd. Google natomiast posiada wiele różnych narzędzi (Gemini, Google Ai Studio, Notebook LM, i kilkanaście mniejszych programów, oraz integracji w tradycyjnych programach, np. Google Workspace). Stąd Gemini ma dużo mniej funkcji niż Chat GPT, za to narzędzia Google oparte na AI, mają dużo więcej funkcji niż Chat GPT. Pewną wadą jest brak wygodnej integracji pomiędzy np. notebookiem LM a Google Gemini.
Czy warto przerzucić się z ChatGPT na Google?
Jeśli:
- robisz szybki research,
- pracujesz na YouTubie lub z filmami,
- masz dużo plików na Google Drive,
- szukasz integracji z Mapami
to narzędzia Google mogą być dobrą alternatywą.
Jeśli:
- zależy Ci na stylu pisania, długich esejach i precyzji językowej,
to ChatGPT nadal jest lepszy.
Ale w praktyce – najlepiej mieć oba narzędzia. I korzystać w zależności od potrzeb.
Podsumowanie: Google wraca do gry
Google potrzebowało ponad dwóch lat, by odpowiedzieć na wyzwanie rzucone przez ChatGPT. Ale dziś nie tylko odpowiada – tworzy alternatywy, które mają sens.
Notebook LM to fenomenalne narzędzie do researchu i nauki. Gemini w końcu działa sprawnie i ma dostęp do rzeczy, których inne modele nie mają. A Google AI Studio daje nam moc tworzenia własnych rozwiązań – za darmo.
To nie jest tekst sponsorowany. To tekst pisany przez kogoś, kto tak jak Ty szuka najlepszego narzędzia do swojej pracy. I po długim czasie mogę powiedzieć: Google naprawdę robi teraz dobre AI.