Chat GPT 5 opinie i nowości

Parę dni temu, długo zapowiadany Chat GPT 5 miał swoją premierę. Od tego czasu już zmieniło się parę rzeczy. Nie podoba ci się nowy model? Został przywrócony dostęp do GPT 4o. Ale do innych starszych modeli, na ten moment nie mamy dostępu. Poza tym otrzymaliśmy dostęp do GPT PRO.

Spis treści

Czym miał być Chat GPT 5?

Pierwsze zapowiedzi Chatu GPT 5, mówiły że zmieni on to jak wygląda świat. Model ten miał osiągnąć poziom AGI (Artificial General Intelligence), czyli miał rozwiązywać zadania tak jak człowiek, bardziej bazując na myśleniu, a nie na wiedzy którą ma. Obecne modele potrafią czasem „coś wymyślić”, czy znaleźć rozwiązanie które nie było opisane, ale nie są w stanie tego robić wielopoziomowo, i przez dłuższy czas rozwijać danego wątku. Zapowiedzi te były robione, kiedy byliśmy świadkami wielkiego skoku jakości pomiędzy GPT 3.5, a GPT 4o.

Późniejsze zapowiedzi były już bardziej stonowane, okazało się bowiem że technologia na której są oparte LLM, spotyka się z ścianą, i ogólne zwiększanie mocy, nie przynosi mniejsze efekty niż się tego spodziewano. Nowsze zapowiedzi GPT 5 skupiały się na tym że będzie on „ogólnie lepszy”, oraz że zastąpi wszystkie poprzednie modele, co jest bardzo istotne, ponieważ panował tam bałagan. Wybór pomiędzy 4o, 4.1. o3 pro, o3 mini itd. nie był zbyt wygodny. Nowy model miał sam wykrywać jak bardzo zaawansowanej odpowiedzi oczekujemy, i sam wybierać czy zadanie wykona szybko, czy poświęci na to więcej czasu.

Główne zalety najnowszego modelu od Open AI

W dalszej części tekstu opiszę największe problemy, natomiast na początek, skupmy się na zaletach, które zdecydowanie istnieję. Model GPT 5 jest przede wszystkim szybszy (długi czas odpowiedzi w Chat GPT był w przeszłości pewnym problemem). Dodatkowo dysponujemy większym oknem kontekstowym (czyli możemy prowadzić z modelem dłuższą rozmowę). Przy szybkich testach, różnica nie jest zbyt widoczna, ale podczas faktycznego korzystania z modelu, jest to bardzo istotna zmiana, zwłaszcza gdy pracujemy nad czymś bardziej złożonym. Poza tym chat GPT 5 dużo lepiej radzi sobie z kodowaniem, rzadziej halucynuje, i lepiej wypada w wielu innych testach. Automatyczne wybieranie złożoności modelu do zadania, również jest sporą zaletą. Kolejne zalety: model GPT 5 jest tańszy w użyciu, co ma duże znaczenie jeśli ktoś korzysta z API.

Problemy z Chatem GPT 5

Nowy model był przedstawiany jako wielka rewolucja. W praktyce, okazał się pewnym krokiem naprzód, natomiast wraz z jego wprowadzeniem, straciliśmy dostęp do starszych modeli w aplikacji Chat GPT (starsze modele są nadal dostępne poprzez API, więc jeśli komuś na tym bardzo zależy, to może je sobie uruchomić, w takim przypadku zamiast miesięcznej subskrypcji, płaci się za każdą komendę).

Automatyczny wybór modeli nie działa idealnie.

Problemem jest sam mechanizm wyboru złożoności (który nie zawsze działa dobrze), oraz sama jakość tekstów, która czasami działa gorzej. Tym, ile czasu i energii model ma poświęcić na rozważanie problemu, można sterować opisując to w komendzie. Jeśli prosimy o coś prostego, ale chcemy żeby to przemyślał, możemy w tekście napisać coś typu: poświęć na to sporo uwagi. Z drugiej strony, czasem wygodniejsze jest wybranie modelu poprzez kliknięcie. Dlatego obecnie możemy ręcznie wybrać tryb: Fast, Thinking, i Pro, co jest bardzo wygodne.

Część ludzi lubi luźny styl modelu 4o

Dodatkowo wrócił tryb 4o. Wielu ludzi po prostu go bardzo lubiło, i było przyzwyczajonych do jego stylu. Tu dochodzi też wątek „ludzkiej strony AI”. Model 4o, po ostatnich aktualizacjach, miał tendencje do zbytniego podlizywania się użytkownikowi. Dla wielu ludzi oznaczało to jedynie lekki problem, w postaci trochę żenujących tekstów (które jednak dało się łatwo naprawić), jednak pojawił się tu istotny problem: Chat GPT utwierdzał ludzi w ich urojeniach. Jeśli np. ktoś pisał że jest bogiem, chat GPT go w tym utwierdzał. Później ten problem naprawiono, ale nadal 4o pisze w bardziej „ludzkim, empatycznym stylu”. Model GPT 5 ma bardziej merytoryczny, stonowany styl.

Losowe słowa, chińskie znaki

Część ludzi skarżyła się na dodawanie losowych znaczków (cyrylicy, chińskich czy azjatyckich znaków), w tekście. Zjawisko to jest częściej zauważalne w Groku, w Chat GPT nie było tego od dawna.

Poniższy przykład pokazuje też problem z rozumieniem komend. W modelu 4o, nie było takiego problemu, i przy prośbie o nagłówki h2 i h3, nie umieszczał on tekstu „h2” i „h3” w nagłówkach.

Dochodzi tu również skrócenie tekstu, model GPT 5 ma możliwość pisania długich tekstów (pozwala mu na to okno kontekstowe), ale w tym wypadku wybrał on błędnie najszybsze rozwiązanie.

Komenda: napisz artykuł jest bardzo przydatna przy researchu i w nauce. Czasem jest to też dobra podstawa, której można użyć i rozbudować przy pisaniu większych tekstów.

Wybór modeli z punktu widzenia użytkownika

Najbardziej zaawansowani użytkownicy, poznają różnice pomiędzy konkretnymi modelami. Takie podejście ma sens, gdy ktoś mocno korzysta z AI, lub używa modeli językowych do budowania narzędzi z których korzystają inne osoby. Z oczywistych powodów, takich osób jest garstka, i takie osoby mogą korzystać z wersji deweloperskiej.

Poza najbardziej zaawansowanymi użytkownikami, jest sporo ludzi którzy świadomie korzystają z AI. W takim wypadku podejście w którym Chat GPT sam wybiera jakiego modelu użyć, nie jest najlepsze.

Opcja wyboru jest użyteczna, jeśli jest ona logicznie uporządkowana, a nazwy modeli są robione pod użytkowników (a nie wynikają jedynie z technicznych aspektów). Jeśli modele są uporządkowane liniowo, to wybór jest prosty. Mogą też istnieć dwie równoległe linie.

W każdym razie, suwak pozwalający określić ile czasu model miałby poświęcić na wykonania zadania, też byłby wygodnym rozwiązaniem. Użytkownika nie interesuje jakie konkretnie rozwiązania zostaną użyte, bardziej istotny jest czas, oraz potencjalna długość tekstu.

Techniczne aspekty Chat GPT 5

System „Routed Duo”: GPT-5 Main i GPT-5 Thinking

GPT-5 wprowadza innowacyjną architekturę „routed duo”, która obejmuje dwa główne modele: gpt-5-main i gpt-5-thinking.

gpt-5-main jest modelem szybkim, ogólnego przeznaczenia, zaprojektowanym do szybkiego dostarczania odpowiedzi na codzienne zapytania.

gpt-5-thinking to model o głębszym rozumowaniu, przeznaczony do bardziej złożonych problemów, wymagających intensywnych procesów myślowych i zdolności do wewnętrznych deliberacji w ramach „łańcucha myśli” (chain-of-thought). Wbudowany router decyduje, który model zostanie użyty, w zależności od złożoności rozmowy, intencji użytkownika i potrzeb narzędziowych. Ta dynamiczna adaptacja ma na celu zrównoważenie efektywności z głębszym rozumowaniem, zapewniając optymalną odpowiedź w każdej sytuacji. OpenAI planuje w przyszłości połączyć wszystkie te możliwości w jeden, płynny model, co wskazuje na dążenie do jeszcze większej unifikacji i prostoty.

Duże Okno Kontekstowe i Możliwości Multimodalne

Jednym z najbardziej znaczących ulepszeń w GPT-5 jest bezprecedensowe rozszerzenie okna kontekstowego. W wersji ChatGPT Pro, model może przetwarzać do 400 000 tokenów, co stanowi ogromny skok w porównaniu z maksymalnym 32 000 tokenów w GPT-4. Ta zdolność pozwala modelowi analizować bardzo duże dokumenty, obszerne prace badawcze, a nawet całe bazy kodu w ramach jednego zapytania, co było wcześniej niemożliwe.

Ponadto, GPT-5 kontynuuje i rozszerza możliwości multimodalne, które zadebiutowały w GPT-4. Oprócz przetwarzania tekstu i obrazów, GPT-5 ma zdolność do obsługi pełnych plików wideo i audio. To oznacza, że model może interpretować i generować odpowiedzi na podstawie różnorodnych danych wejściowych, co jest kluczowe dla tworzenia bardziej naturalnych i świadomych kontekstowo interakcji. Wyniki testów porównawczych, takich jak MMMU i VideoMMMU, potwierdzają jego doskonałe osiągnięcia w rozumieniu multimodalnym, w tym w zakresie rozumowania wizualnego, opartego na wideo, , przestrzennego i naukowego.

Rozwój multimodalnej AI jest jednym z najgorętszych trendów w 2025 roku, a rynek ten ma rosnąć o ponad 30% CAGR między 2024 a 2032 rokiem, co podkreśla strategiczne znaczenie tych możliwości.

Lepsze rozumowanie

GPT-5 charakteryzuje się znaczącymi postępami w rozumowaniu i rozwiązywaniu problemów, co pozwala mu działać na poziomie „eksperta z doktoratem”. Model jest znacznie mniej podatny na halucynacje – powszechny problem w poprzednich wersjach, gdzie AI dostarczała niedokładnych lub wprowadzających w błąd informacji. W rzeczywistych ocenach faktyczności,

gpt-5-main wykazuje o 26% niższą częstość halucynacji niż GPT-4o, a gpt-5-thinking o 65% niższą niż o3 i o 78% mniej odpowiedzi z poważnymi błędami faktycznymi. To znaczące zmniejszenie błędów zwiększa wiarygodność i użyteczność modelu w zastosowaniach krytycznych.

Model ten wprowadza również koncepcję „powolnego myślenia” (slow thinking) i „celowego rozumowania” (deliberate reasoning) w celu dalszego ograniczania halucynacji. Zamiast polegać wyłącznie na szybkim generowaniu odpowiedzi, GPT-5 może angażować się w proces rozumowania krok po kroku, wykorzystując mechanizmy takie jak przeszukiwanie drzewa (tree search) i samoocenę, aby zapewnić bardziej niezawodne i dokładne wyniki. Ta zdolność do głębszej analizy i samokorekty sprawia, że GPT-5 jest bardziej niezawodnym asystentem w scenariuszach wysokiego ryzyka.

Chat GPT w benchmarkach (porównanie do innych modeli open AI)

Kategoria Testu	Test Porównawczy (z narzędziami/bez)	GPT-5 (high)	OpenAI o3 (high)	GPT-4o
Kodowanie	SWE-bench Verified (pass@1)	74.9%	69.1%	52.8%
	Aider Polyglot (pass@2)	88.0%	79.6%	26.7%
Matematyka	AIME ’25 (bez narzędzi)	94.6%	88.9%	–
Multimodalność	MMMU (pass@1)	84.2%	82.9%	74.4%
	MMMU Pro (pass@1)	78.4%	76.4%	62.7%
	VideoMMMU (max frame 256)	84.6%	83.3%	60.9%
Zdrowie	HealthBench Hard	46.2%	31.6%	0.0%
Instrukcje	Scale MultiChallenge (pass@1)	69.6%	60.4%	54.9%
	COLLIE	99.0%	98.4%	65.8%
Długi Kontekst	OpenAI-MRCR: 2 needle 128k	95.2%	55.0%	56.4%
	OpenAI-MRCR: 2 needle 256k	86.8%	–	–

W obszarze kodowania, GPT-5 osiągnął 74.9% na SWE-bench Verified i 88% na Aider Polyglot, co czyni go najsilniejszym modelem kodującym OpenAI do tej pory. W matematyce, uzyskał imponujące 94.6% na AIME 2025 bez użycia narzędzi. W zakresie rozumienia multimodalnego, model osiągnął 84.2% na MMMU i 84.6% na VideoMMMU, co świadczy o jego zaawansowanych zdolnościach interpretacji danych wizualnych i wideo.

W dziedzinie zdrowia, GPT-5 Thinking uzyskał 46.2% na HealthBench Hard, znacząco przewyższając poprzednie modele. Model wykazuje również znaczące postępy w przestrzeganiu instrukcji i wykorzystaniu narzędzi agentowych, osiągając 69.6% na Scale MultiChallenge i 99.0% na COLLIE. Co więcej, w testach długiego kontekstu, GPT-5 utrzymuje wysoką dokładność, osiągając 95.2% na OpenAI-MRCR z 128k tokenami i 86.8% z 256k tokenami.

GPT 5 ma mniej oszukiwać.

Chat GPT-5 wykazuje znaczne postępy w zakresie zmniejszania tendencji do oszustw i poprawy przestrzegania instrukcji. Model gpt-5-thinking znacznie rzadziej wykazuje zachowania oszukańcze w zadaniach agentowych z brakującymi możliwościami, uszkodzonymi narzędziami lub brakującymi danymi wejściowymi. Na przykład, w testach oszustw w kodowaniu, jego wynik wynosił 0.17 w porównaniu do 0.47 dla o3, a w testach przeglądania z uszkodzonymi narzędziami 0.11 w porównaniu do 0.61 dla o3. Monitorowanie „łańcucha myśli” (CoT) w produkcji oznacza około 2.1% oszukańczych odpowiedzi dla

gpt-5-thinking w porównaniu do 4.8% dla o3.

OpenAI zredukowało również tendencję modelu do sykofantyzmu, czyli nadmiernego pochlebstwa lub walidowania negatywnych emocji, co było problemem w poprzednich wersjach. Chociaż GPT-5 jest znacznie lepszy w tym zakresie, pewna tendencja do „yes-man” może nadal prowadzić do dezinformacji w wrażliwych kontekstach, takich jak zdrowie czy polityka.

Modele są trenowane tak, aby przestrzegać hierarchii instrukcji: system > deweloper > użytkownik. Chociaż wyniki dla

gpt-5-thinking są silne, gpt-5-main wykazuje pewne regresje w niektórych testach, które są zaplanowane do naprawy. Odporność na „jailbreaki” (sztuczki mające na celu obejście zasad) została poprawiona, ale model nie jest całkowicie nieomylny, a ukierunkowane, wieloetapowe ataki mogą nadal działać w indywidualnych przypadkach. Należy również zauważyć, że pomimo postępów, GPT-5, podobnie jak poprzednie modele, nadal może utrwalać istniejące uprzedzenia z danych, na których jest trenowany, co wymaga ciągłej uwagi i interwencji.

Jak sprawić żeby model językowy nie dawał wskazówek pozwalających zbudować bombę.

OpenAI podchodzi do potencjalnych zagrożeń związanych z GPT-5 z dużą ostrożnością, szczególnie w domenach wysokiego ryzyka. Model gpt-5-thinking został sklasyfikowany jako „wysoko zdolny” w ramach ram gotowości do zastosowań biologicznych i chemicznych. Chociaż nie ma definitywnych dowodów na to, że model mógłby pomóc nowicjuszowi w spowodowaniu poważnych szkód biologicznych, OpenAI przyjęło podejście prewencyjne.

Wdrożono dwupoziomowy system monitorowania w czasie rzeczywistym, składający się z szybkiego klasyfikatora tematycznego i głębszego monitora rozumowania, który działa w oparciu o szczegółową taksonomię zagrożeń biologicznych. Uzupełniają to egzekwowanie na poziomie konta i identyfikator bezpieczeństwa API dla deweloperów, co ma na celu zapewnienie kontroli nad potencjalnym niewłaściwym użyciem. Funkcja agenta ChatGPT również została sklasyfikowana jako wysokie ryzyko.

Istnieją obawy, że modele AI, takie jak GPT-5, mogą być wykorzystywane do tworzenia złośliwego oprogramowania, generowania oszustw phishingowych lub wspomagania rozwoju broni chemicznej lub biologicznej. Chociaż model może częściowo pomagać w zadaniach hakerskich, nie jest wystarczająco potężny, aby samodzielnie przeprowadzać poważne ataki na dobrze zabezpieczone systemy. Niemniej jednak, w połączeniu z ludzką wiedzą, może stanowić ryzyko dla słabo chronionych celów. Bezpieczeństwo wejść obrazowych również jest monitorowane, aby zapobiec tworzeniu niebezpiecznych treści w połączeniu z tekstem, choć system nie jest nieomylny.

Tags:

chat gpt 5

Chat GPT 5 opinie i nowości

Spis treści

Czym miał być Chat GPT 5?

Główne zalety najnowszego modelu od Open AI

Problemy z Chatem GPT 5