KI-Bilder mit ChatGPT: Was das neue Bilder-Tool kann
Sicherlich hast du schon einmal versucht, mithilfe einer KI ein Bild zu erstellen. Das klingt einfach und du bekommst auch schnell ein Ergebnis. Du hast eine klare Vorstellung im Kopf und beschreibst das Bild so genau wie möglich. Trotzdem interpretiert die KI vieles anders als erwartet. Oft reicht schon eine kleine Änderung am Bild, um das komplette Motiv neu zu generieren. Das Ergebnis fühlt sich manchmal eher zufällig als kontrollierbar an.
OpenAI, der Anbieter von ChatGPT, hat die KI-Bilderzeugung überarbeitet und ist selbst von den Neuerungen begeistert. Sehen wir uns das einmal genauer an.
(Letzte Aktualisierung: 18.12.25)KI-Bildbearbeitung statt kompletter Neugenerierung
Laut OpenAI liegt die größte Neuerung in der gezielten Bearbeitung vorhandener Bilder. Du kannst nun ein Bild hochladen und nur bestimmte Elemente davon verändern lassen, ohne dass das gesamte Motiv neu interpretiert wird. Dabei bleiben Lichtstimmung, Bildaufbau und sogar das Aussehen von Personen erhalten.
Du kannst beispielsweise die Kleidung austauschen, Objekte hinzufügen oder den Stil einzelner Bildbereiche verändern. Dabei bleibt das Bild stets erkennbar dasselbe. Ich denke, das testen wir gleich einmal aus.

Wow! Ich bin wirklich beeindruckt. Links das Originalbild und rechts das von ChatGPT veränderte Foto: Blaue Blüte und anderer Hintergrund. Selbst wenn ich den kleinen Käfer auf der Blüte vergrößere, taucht dieser an der gleichen Stelle im KI-Foto auf. Ich muss sagen, OpenAI hält, was es mit dieser Funktion versprochen hat. Das hätte ich nicht gedacht.
Mithilfe dieser neuen Funktion kannst du dein Bild Schritt für Schritt verfeinern. Das funktioniert ähnlich wie bei einem Bildbearbeitungsprogramm. ChatGPT wandelt sich somit vom reinen Generator zum KI-Bildwerkzeug.
Anweisungen werden zuverlässiger umgesetzt.
Ein weiterer Schwachpunkt früherer Bildmodelle war das Befolgen komplexer Anweisungen. Mehrere Objekte, feste Anordnungen oder klare Reihenfolgen führten oft zu fehlerhaften Ergebnissen.
Das neue Modell soll damit deutlich besser zurecht kommen. OpenAI zeigt dies unter anderem anhand eines Beispiels, bei dem ein 6×6-Raster mit 36 unterschiedlichen Objekten in einer exakten Reihenfolge erzeugt wird. Während frühere Versionen daran scheiterten, setzt das neue Modell diese Vorgabe korrekt um. Du kannst dir das Beispiel auf der ➥Seite von OpenAI anschauen.
Für dich bedeutet das: Du kannst gezielt mit Layouts arbeiten. Storyboards, Infografiken, technische Skizzen oder strukturierte Szenen lassen sich so zuverlässiger umsetzen. Ich habe das allerdings noch nicht selbst getestet.
Text in KI-Bildern ist gut lesbar.
Der Text war lange Zeit eine der großen Schwächen von KI-Bildern. Obwohl sich das in letzter Zeit schon sehr verbessert hat, kommt es immer noch zu unleserlichen Buchstaben oder falschen Wörtern.
Mit dem neuen KI-Bild-Modell von ChatGPT funktioniert das jetzt noch besser. Auch längere und dichtere Texte können korrekt in Bildern angezeigt werden.
Ich denke, ich nehme mal eine schwierigere Aufgabe. Eine Zeitung, die einen meiner Artikel veröffentlicht. Und so sieht das aus:

Ganz ordentlich. Doch wenn du genauer hinschaust, stellst du fest, dass einzelne Buchstaben falsch sind. Vielleicht sieht es in englischer Sprache anders aus. Im Vergleich zu früher ist das aber um einiges besser geworden.
Neue KI-Bild Funktionen
Auch die Benutzeroberfläche wurde angepasst. In der Seitenleiste von ChatGPT gibt es nun einen eigenständigen Bereich für Bilder. Dort findest du vorbereitete Stile, Filter und Beispiel-Prompts, die dir den Einstieg erleichtern oder dich inspirieren sollen.
Du kannst auch ein eigenes Referenzbild hochladen und es einem anderen Stil anpassen. Dieses Foto lässt sich dann in weiteren Bildern wiederverwenden.

Auch die Generierungsgeschwindigkeit soll verkürzt worden sein. Bisher war die KI-Bildgenerierung von ChatGPT im Vergleich zu anderen KI-Bildgeneratoren sehr langsam. Erwarte aber nicht zu viel!
Änderungen auch in der API
Über die API ist nun das Modell „GPT Image 1.5” verfügbar.
Eine API ist eine Schnittstelle, über die Programme miteinander kommunizieren. In diesem Fall ermöglicht sie die direkte Integration der Bildfunktionen von ChatGPT in eigene Webseiten, Shops oder Arbeitsabläufe. Allerdings ist die Nutzung der API nicht kostenlos. Mit dieser neuen Funktion wurde die API-Nutzung jedoch rund 20 Prozent günstiger.
Fazit und Zusammenfassung
Die Entwicklung der KI-Bildgenerierung ähnelt einem nie endenden Kreislauf. Kaum hat man sich an die neuesten Möglichkeiten gewöhnt, folgt schon das nächste Update. Bestehende Schwächen werden reduziert und es kommen neue Funktionen hinzu. Auch bei der aktuellen Version gibt es noch einige Punkte, die verbessert werden können. Ich denke dabei an die Textdarstellung in KI-Bildern. Das wird nicht die letzte Weiterentwicklung gewesen sein.
Am meisten beeindruckt hat mich die Möglichkeit, Bilder gezielt zu bearbeiten und zu verändern. Ob sich dadurch die klassische Bildbearbeitung mit Programmen wie Photoshop verändern wird, bleibt abzuwarten.
Neu: Dein KI-Start leicht gemacht
Du interessierst dich für Künstliche Intelligenz im Alltag? In meinem Buch findest du praxisnahe Erklärungen, Beispiele und sofort umsetzbare Tipps – ganz ohne Vorwissen.
➥ Jetzt reinlesen: kostenlose Leseprobe sichern (PDF Dokument zum Download) oder
➥ direkt bei Amazon anschauen
Interessante Artikel zum Thema: KI-Bilder
Adobe Firefly: KI Bild- und Grafikfunktionen
Mit Adobe Firefly kannst du KI-Bilder generieren, Texturen erstellen und einiges mehr. Doch schau selbst.
Mehr lesenKI: generativer Füllung von Adobe
Die generative Füllung von Adobe verändert die Bildbearbeitung. Ein paar Beispiele, was du damit machen kannst.
Mehr lesenCanva KI: KI-Bilder erzeugen und bearbeiten
Einführung in die Erstellung von KI-Bildern mit Canva. Tipps und Tricks. Detaillierte Anleitung.
Mehr lesenBild generieren mit Midjourney und künstlicher Intelligenz
Gib einen Text ein und Midjourney generiert dir ein Bild. Wie du deinen Account einrichtest und das erste Bild erzeugst.
Mehr lesen▸ Und nun noch etwas zum Schmunzeln
Krimi und Sofa: Wer war der Täter?
Antworten auf wirklich wichtige Fragen des Lebens. Beantwortet von meinem kleinen, depressiven KI-Roboter:
Wir liegen auf dem Sofa und schauen einen Krimi. Sind wir eingenickt und wer war der Täter?
Zur Zeit gibt es noch keinen Kommentar zu diesem Thema. Das ist deine Chance 😉