GPT-Image-1.5 radzi sobie z napisami po polsku. Co jeszcze robi?

OpenAI wprowadził w grudniu 2025 roku GPT-Image-1.5, nowy model do generowania obrazów w ChatGPT. Użytkownicy otrzymują dostęp do szybszego tworzenia grafik, precyzyjnych edycji zachowujących szczegóły oraz dedykowanej przestrzeni kreatywnej w interfejsie. Na przykładzie infografiki w języku polskim widać, że możliwości graficznego AI są coraz potężniejsze.

Treść stworzona przy asyście AI

Takie eleganckie infografiki tworzy GPT-Image-1.5

Tworzenie grafik czy edycja zdjęć to jedna z najrzadziej wykorzystywanych przeze mnie możliwości generatywnej sztucznej inteligencji. Może się to zmienić, ponieważ modele najnowszej generacji wydają się spełniać nawet dość wyśrubowane wymagania. Za takowe uważam szczególnie polecenia związane z infografikami w języku polskim, pełnym specjalnych znaków charakterystycznych wyłącznie dla naszej mowy ojczystej.

Prompt związany z infografiką na podstronę o podstawach SEO i AI Search wpisywałem bardziej z ciekawości. Nie był specjalnie skomplikowany, bo zwyczajnie nie spodziewałem się, że będzie to miało sens. Moje wcześniejsze doświadczenia z ChatemGPT określić można pod tym kątem najdelikatniej jako stanowczo rozczarowujące. Tymczasem wrzucenie trzech nagłówków H3 wraz z ich treścią oraz określenie kolorystyki (Color palette: predominantly blue tones (#1565c0 to #42a5f5) with white highlights, Google brand colors for accents (red #ea4335, yellow #fbbc04, blue #4285f4, green #34a853) doprowadziło do stworzenia całkiem niezłej infografiki.

Infografika stworzona przez GPT-Image-1.5

Przy nieco bardziej skomplikowanych wytycznych (o nich szerzej w artykule Jak wygenerować infografikę AI) wyszło mniej chaotycznie i chyba nieco gorzej, jeśli chodzi o polskie znaki, ale również wystarczająco dobrze:

Infografika wygenerowana w ChatGPT (GPT-Image-1.5) przy bardziej skomplikowanym prompcie

Jak pokazuję we wpisie na temat tworzenia infografik za pośrednictwem AI, wyścig pod tym kątem zdecydowanie wygrywa jednak Google. Nano Banana Pro nakłada treści w języku polskim bez analogicznych błędów związanych z polskimi znakami diakrytycznymi, co zobaczyć możecie chociażby tutaj:

Jak wygenerować infografikę w Gemini? Propozycja nr 7

A co na temat nowego modelu generowania i edycji obrazów mówi OpenAI?

Nowy standard w edycji i generowaniu obrazów

OpenAI udostępniło GPT-Image-1.5 — zaktualizowaną wersję systemu generowania obrazów w ChatGPT. Według firmy, model generuje grafiki nawet 4 razy szybciej niż poprzednia wersja, jednocześnie zwiększając precyzję edycji. Nowa funkcja jest dostępna od 16 grudnia 2025 dla wszystkich użytkowników ChatGPT oraz developerów korzystających z API.

GPT-Image-1.5 zachowuje kluczowe elementy obrazu podczas modyfikacji — oświetlenie, kompozycję i wygląd osób pozostają spójne przez kolejne iteracje edycji. OpenAI projektowało system z myślą o praktycznych zastosowaniach: realistycznych przymiarkach ubrań i fryzur, filtrach stylistycznych oraz koncepcyjnych przekształceniach zachowujących esencję oryginału.

Model radzi sobie z różnorodnymi rodzajami edycji. Dodawanie, usuwanie, łączenie i transponowanie elementów nie powoduje utraty charakteru obrazu — zmiany dotyczą tylko wskazanych fragmentów grafiki.

Rozszerzone możliwości i nowa przestrzeń kreatywna

GPT-Image-1.5 wprowadza szereg ulepszeń technicznych. Według OpenAI, najważniejsze zmiany to:

Wykonywanie instrukcji: Model lepiej realizuje złożone polecenia niż GPT Image 1.0, zachowując relacje między elementami zgodnie z zamierzeniem użytkownika.
Renderowanie tekstu: System obsługuje gęstsze i mniejsze kroje czcionek, precyzyjniej odwzorowując napisy w grafice.
Renderowanie wielu twarzy: Poprawiona wierność w przedstawianiu wielu małych twarzy na jednym obrazie.
Naturalny wygląd: Generowane grafiki wyglądają bardziej naturalnie niż w poprzedniej wersji.

OpenAI dodało dedykowaną przestrzeń Images w pasku bocznym ChatGPT — zarówno w aplikacji mobilnej, jak i na stronie chatgpt.com. Użytkownicy znajdują tam dziesiątki wstępnie skonfigurowanych filtrów oraz poleceń pobudzających kreatywność, które firma regularnie dostosowuje do aktualnych trendów. System pozwala na jednorazowe przesłanie własnego wizerunku i wielokrotne wykorzystanie go w przyszłych kreacjach bez konieczności ponownego wgrywania zdjęć.

Jak wygląda to w praktyce poza wspomnianymi już infografikami? Chociaż staram się unikać tak mocnych słów, przyznać muszę, że dość imponująco. Wynik dla wpisanego przeze mnie promptu „Zrób współczesne zdjęcie na podstawie mleczarki Vermeera” to jedna z fajniejszych rzeczy, jakie widziałem ostatnio w internecie:

GPT-Image-1.5 dla promptu "Zrób współczesne zdjęcie na podstawie mleczarki Vermeera"

Nieco bardziej skomplikowane polecenie „Zrób współczesne fotorealistyczne zdjęcie na podstawie Szczygła Carela Fabritiusa, tyle że na świeżym powietrzu (ale również z łańcuszkiem)„? Równie elegancki wynik:

GPT-Image-1.5 dla promptu "Zrób współczesne fotorealistyczne zdjęcie na podstawie Szczygła Carela Fabritiusa, tyle że na świeżym powietrzu (ale również z łańcuszkiem)"

Nowy model umożliwia kontynuowanie generowania kolejnych obrazów podczas renderowania poprzednich. Użytkownicy eksplorują więcej pomysłów bez oczekiwania na zakończenie poprzednich zadań.

Zastosowania biznesowe i dostępność w API

GPT-Image-1.5 w API oferuje 20% niższe koszty obsługi danych wejściowych i wyjściowych w porównaniu z GPT Image 1. Według OpenAI, firmy z branż kreatywnych, e-commerce, programistycznych i marketingowych już korzystają z nowego modelu — wśród nich Wix, Canva, Higgsfield, Figma Weave i Envato.

Hila Gat, kierownik ds. badań nad sztuczną inteligencją i analizą danych w Wix, podkreśla praktyczne zalety: „GPT Image 1.5 generuje obrazy o wysokiej wierności, ściśle przestrzega poleceń i zachowuje kompozycję, oświetlenie oraz drobne szczegóły. Na podstawie naszych testów możemy stwierdzić, że jest to jeden z najlepszych modeli do generowania obrazów na rynku„.

Model wspiera pracę zespołów e-commerce przy tworzeniu pełnych katalogów produktów: warianty, sceny i kąty można generować z jednego obrazu źródłowego. Zachowuje spójność logo marek i kluczowych wizualizacji podczas edycji, co według OpenAI czyni go idealnym rozwiązaniem dla działań marketingowych i zadań związanych z obsługą marki.

Firma przyznaje, że model wciąż nie jest doskonały. Testy porównawcze pokazują wyraźną poprawę wyników w różnych przypadkach użycia względem poprzedniej wersji, ale OpenAI planuje kolejne iteracje usprawniające system.

Źródło

Nowość – ChatGPT Images już dostępny

Te artykuły powinny Cię zainteresować

O autorze

Nazywam się Michał Małysa i od wielu lat zajmuję się zawodowo SEO oraz analizą treści, a od 2023 roku w zakres moich obowiązków i zainteresowań dość naturalnie weszło AI. Na stronie MałySEO porządkuję wiedzę o pozycjonowaniu stron internetowych, AI Search oraz działaniu LLM-ów. Prowadzę również MałySEO Newsletter, do którego subskrypcji serdecznie Cię zachęcam na podstronie najlepszego w Polsce newslettera SEO.

Jako że przygotowanie materiałów do MałySEO Newslettera oraz na bloga zajmuje nieco czasu, może zaświtać Ci w głowie dość miły z mojej perspektywy pomysł drobnego rewanżu. Jeżeli uznasz, że lektura tego wpisu była dla Ciebie czymś więcej, niż tylko szybkim odklepaniem randomowej internetowej treści, możesz postawić mi kawkę na buycoffee.to. Z góry dziękuję!

Jeżeli z jakiegoś powodu potrzebujesz się ze mną skontaktować, wyślij mail na adres kontakt[at]michalmalysa.pl