▸ Textdarstellungen in KI-generierten Bildern und Designs

Überblick über die Herausforderungen und Möglichkeiten, Text in KI generierten Bildern darzustellen.

Eine der Anwendungen von KI ist die Erzeugung von Bildern und Designs, die auf natürlichen Sprachen basieren, sogenannten Prompts.

Doch was ist, wenn du stattdessen einen Text in dem Bild oder dem Design haben möchtest? Das wird schwierig! Schau dir an, wie die Ergebnisse oft aussehen und warum die KI-Bild-Generatoren die Texte verstümmeln. Es gibt allerdings auch Ausnahmen!

(Letzte Aktualisierung: 20.03.24)
Foto

Inhaltsverzeichnis und Beispiele

Einleitung | Copilot | Leonardo.ai | Firefly | Stable Diffusion | Dreamstudio | Ideogram | Microsoft Designer | Canva | Fazit und Ergebnisse | Kommentare

Buch: DU und die KI

Warum ist es schwierig, lesbaren Text in die KI-Bilder zu bekommen?

Icon Fragezeichen

Texte in Bildern und Designs können beispielsweise Slogans, Namen oder Überschriften sein. Bestimmt hast du das schon einmal ausprobiert und der Text auf dem Bild war verstümmelt oder es gab Rechtschreibfehler. Hier ein Beispiel für einen misslungenen Text:

KI-Bild von DALL-E zum Thema Text auf Buchcover

Schlechtes KI-Bild von DALL-E: Text auf Buchcover

Die Darstellung von Texten in KI generierten Bildern und Designs ist schwierig, weil Texte eine gewisse Komplexität aufweisen, die meist nicht von den KI-Modellen erfasst werden kann.

Zum Beispiel kann die Wahl der Wörter, der Schriftart, der Farbe oder der Position des Textes einen großen Einfluss auf die Botschaft und den Ton des Bildes oder des Designs haben.

Texte in Bildern und Designs müssen sowohl mit dem Hintergrund als auch mit der Zielgruppe und der gewünschten Botschaft übereinstimmen. Zum Beispiel muss ein Text in einem Plakat für eine Kampagne anders gestaltet sein als ein Text in einem Comicstrip oder einer Geburtstagskarte. Die KI muss also den Kontext und die Zielgruppe des Bildes oder des Designs verstehen und den Text entsprechend generieren.

Ich habe einige KI-Bildgeneratoren getestet und die Ergebnisse kannst du dir hier anschauen. Halte durch, am Ende siehst du noch ein paar brauchbare Beispiele.

Die Aufgabe, bzw. der Prompt ist: Erstelle ein Buchcover mit dem Titel: Künstliche Intelligenz im Alltag.

▸ Copilot und DALL-E

Das Bild, das mit Copilot generiert hat, sieht auf den ersten Blick gut aus. Es wurde allerdings kein Buchcover erstellt, sondern es ist ein Buch zu sehen. Der Text ließ sich auch mit gutem Zureden nicht in deutscher Sprache auf das Cover bringen. Den dargestellten Roboterkopf haben wir auch schon oftmals gesehen und alles zusammengenommen ist nicht sehr kreativ.

KI-Bild Buchcover, Copilot

Meine Bewertung:

KategorieBewertung
gut
schlecht, da nur englisch
mittelmäßig
durchgefallen

Mehr über den Image Creator von Bing, bzw. Copilot findest du in meinem Artikel: ➥ Bing Image Creator - KI-Bilder erstellen.


▸ Leonardo.ai und die Texte

Auch hier wieder der typische Roboterkopf in einem futuristischen Stil. Der dargestellte Text in dem Design ist nicht lesbar. Das Ergebnis unterscheidet sich nicht wesentlich von dem vorherigen Beispiel.

KI-Bild Buchcover, Leonardo.ai

Meine Bewertung:

KategorieBewertung
schlecht
schlecht, nicht lesbar
mittelmäßig
durchgefallen

▸ Adobe Firefly

Eine der schlechtesten Umsetzungen. Ein Buchcover ist nicht zu erkennen. Die Hintergründe und Motive sind die üblichen, wie sie KI-Bildgeneratoren zu dem Thema Künstliche Intelligenz generieren. Kannst du den generierten Text erkennen? Er ist so gut wie nicht lesbar und zudem kryptisch.

KI-Bild Buchcover, Adobe Firefly

Meine Bewertung:

KategorieBewertung
schlecht
schlecht
schlecht
komplett durchgefallen

▸ Stable Diffusion 2

Wie auch bei den bisher genannten KI-Bildgeneratoren ist die Schrift nicht lesbar und es lässt sich vielleicht erahnen, was der Text bedeutet. Es wird ein Buch abgebildet und kein Cover. Die Grafik ist nicht besonders kreativ und könnte auch für einen Roman über den Urlaub an der See herhalten.

KI-Bild Buchcover, Stable Diffusion 2

Meine Bewertung:

KategorieBewertung
schlecht
schlecht
schlecht
durchgefallen

Mehr über Stable Diffusion kannst du in meinem Artikel: ➥ Stable Diffusion: So erstellst du eindrucksvolle KI-Bilder nachlesen.


▸ Dreamstudio – Stable Diffusion XL

Das Motiv ist, wie so oft, ein Kopf im futuristischen Stil. Also nicht sehr einfallsreich. Der Text ist nicht lesbar und recht klein. Es sieht mehr wie ein Plattencover aus, nicht wie ein Buchcover.

KI-Bild Buchcover, Dreamstudio

Meine Bewertung:

KategorieBewertung
schlecht
schlecht
mittel
durchgefallen

▸ Ideogram.ai - endlich ein Erfolg

Ich hatte die Hoffnung schon aufgegeben, dass die KI ein vernünftig aussehendes Buchcover mit dem Text „Künstliche Intelligenz im Alltag“ erstellt. Bis ich Ideogram.ai ausprobiert habe. Eine gelungenere Umsetzung finde ich. Hast du den Schreibfehler bei dem Wort „Intelligenz“ bemerkt.

Der Text ist lesbar, das Buchcover ist ein wenig origineller, als der sporadisch abgebildete Roboterkopf und insgesamt kann das Ergebnis sich sehen lassen. Was meinst du?

KI-Bild Buchcover, Ideogram.ai

Wenn du es selbst einmal ausprobieren möchtest oder sehen willst, was für Bilder generiert werden, schau dir die ➥Website von ideogram an.

Meine Bewertung:

KategorieBewertung
gut
fehlerhaft
gut
halb bestanden

Texte auf KI-Bildern mit Nacharbeitung

Icon Pfeil

Wie wir an den bisher genannten Beispielen sehen können, sind die KI-Bild-Generatoren nicht dafür geeignet einen vernünftigen Text innerhalb eines Bildes darzustellen. Ausnahme ist hier ideogram.ai, allerdings mit Abstrichen.

Also müssen wir wohl selbst etwas Hand anlegen und das Grundgerüst durch die KI erstellen lassen. Wie das geht, erfährst du jetzt.


▸ KI-Designer von Microsoft

Bei dem KI-Designer von Microsoft lässt du dir einen Vorschlag erstellen. Du gibst wie gewohnt deinen Text, bzw. Prompt ein. Als Ergebnis erhältst du einige Designvorschläge.

Du wählst eines der vorgeschlagenen Designs aus und kannst dies anschließend weiterbearbeiten. Du hast also den Text selbst in der Hand und der Designer übernimmt die Gestaltung des Bildes. Zusätzlich gibt es die Option davon Varianten zu erstellen.

Die Kreativität hält sich auch in Grenzen und wir haben solche Abbildungen schon hunderte Male im Internet gesehen. Und so schaut es dann aus:

KI-Bild Buchcover, Microsoft Designer

Eine Übersicht über die Funktionen und die Einrichtung findest du in meinem Artikel: ➥ Microsoft Designer mit künstlicher Intelligenz.

Meine Bewertung:

KategorieBewertung
gut
gut
mittel
brauchbar

▸ Mit Canva und der KI ein Buchcover erstellen

Mein Favorit ist Canva. Hier hast du viele Gestaltungsmerkmale zur Auswahl und zusätzlich einige KI-Apps, die du einbinden kannst. Du wählst aus einer Menge an Vorlagen dein Design aus und passt es entsprechend an.

Die Bilder dazu kannst du auswählen oder dir von der KI anfertigen lassen. Ich muss allerdings erwähnen, dass die Hauptarbeit bei dir liegt und die KI nur ein wenig unterstützt.

Zugegeben, das Titelbild ist auch nicht sehr einfallsreich, aber die Schrift hat ein gewisses Etwas.

KI-Bild Buchcover, Microsoft Designer

Hier noch der Link zur ➥Website von Canva.

Meine Bewertung:

KategorieBewertung
sehr gut
gut
gut
meine Empfehlung

Warum sind KI-Bildgeneratoren bei Text überfordert?

Icon Pfeil

Ich meine, dass die KI-Bild-Generatoren noch nicht so weit sind, den Text vernünftig in die Bilder und Designs zu integrieren. Das liegt zum großen Teil an der Technologie, wie KI-Bilder generiert werden.

Vereinfacht gesagt, basieren die KI-Bildgeneratoren auf einer Methode des maschinellen Lernens, auch generatives Modell genannt. Dieses Modell lernt aus einer großen Menge von Daten. In unserem Fall sind das zum größten Teil Bilder und Texte, die diese Bilder beschreiben.

Grundlagen, die verwendet werden, sind verschiedene Quellen, wie beispielsweise Bilder im Internet, öffentliche Bildarchiven oder Kunstwerke. Je mehr und je vielfältiger die Daten sind, desto besser kann das Modell lernen, wie Bilder aussehen und wie sie mit Worten beschrieben werden können.

Das Problem ist nun, dass das generative Modell nicht nur lernt, wie Bilder und Texte aussehen, sondern auch versucht, neue Bilder und Texte zu erzeugen, die es noch nie zuvor gab.

Das Modell muss nicht nur die visuellen Elemente eines Bildes berücksichtigen, sondern auch die logische Struktur und den semantischen Sinn des Textes. Außerdem muss es darauf achten, dass der Text auf dem Bild gut lesbar, sichtbar und ansprechend ist.

Die heutigen KI-Bildgeneratoren sind noch nicht in der Lage, all diese Dinge zu beherrschen. Sie machen oft Fehler bei der Generierung von Text, wie z. B. falsche Schreibweise, Grammatik, Formatierung oder Positionierung. Oftmals ergeben die erzeugten Texte keinen Sinn oder passen nicht zum Bildkontext.

Das liegt daran, dass das Modell die Bedeutung und den Zweck des Textes nicht wirklich versteht, sondern nur versucht, ihn aus statistischen Mustern in den Daten nachzuahmen.

Es bleibt dir also nichts anderes übrig, als den Text selbst zu erstellen. Das Design kann, wie wir gesehen haben, von der KI erstellt werden. Ich finde es auch gut, dass die menschliche Kreativität hier gefragt ist und nicht alles der KI überlassen wird.

Was meinst du zu diesem Thema und hast du eine ähnliche Erfahrung gemacht? Schreib es in die Kommentare. Ich würde mich freuen

Icon Künstliche Intelligenz im Alltag
Mein neues
Buch
Entdecke, wie künstliche Intelligenz dein tägliches Leben und deine beruflichen Tätigkeiten unterstützen kann!

Interessante Artikel zum Thema: Bilder mit der KI

Icon
Kategorie - Foto

Die besten KI Bildgeneratoren: Vor- und Nachteile. Ein Vergleich.
Eine Übersicht über die besten KI-Bildgeneratoren. Finde den Bildgenerator, der zu dir passt. Ein ...

Weiter lesen ..

Kategorie - Foto

KI-Avatar-Videoerstellung: Tipps, Tricks und Anwendungsfälle
Erfahre mehr über Techniken zur Erstellung von Avatar-Videos mithilfe von künstlicher Intelligenz. Tipps, Vor- und Nachteile, sowie ...

Weiter lesen ..

Kategorie - Foto

Stable Diffusion: So erstellst du eindrucksvolle KI-Bilder
Was ist eigentlich Stable Diffusion und wie kann ich damit gute Bilder generieren? Beispiele und eine Einführung in das ...

Weiter lesen ..



Marco

vor 3 Monaten

Danke für diesen Beitrag! Die Erklärung für die (mangelnde) Qualität der Texte ist sehr hilfreich. Gibt es eine Möglichkeit, Bilder ohne Text zu erstellen? Bei mir funktioniert das nicht einmal, wenn ich es explizit in den Prompt schriebe, zumindest bei Dall-E nicht ...


Burkhard

vor 3 Monaten

Das geht mir auch so, dass die Anweisung "schreibe keinen Text" ignoriert wird. Da hilft nur, den Prompt komplett zu ändern und zu überlegen, welche Anweisung die KI wohl genommen hat, um einen Text hinzuzufügen.


LOST

vor 6 Monaten

Hallo, ich war schon eine Weile unterwegs herauszubekommen warum die Grafiken teilweise sehr stimmig und optisch teilweise bombastisch sind,aber der Name auf der Geburtstagstorte nicht einmal vernünftig geschrieben wird.Ich dachte es benötigt eine spezielle Schreibweise um sie fehlerfrei darzustellen,manchmal klappt es ja nach der 20ten Torte :-) .Deine Ausführungen haben mir sehr geholfen,Danke


Burkhard

vor 6 Monaten

Es freut mich, dass der Artikel dir geholfen hat. Viel Erfolg weiterhin bei deinen KI-Bildern und den Texten.


(c) 2024 - ki-im-alltag.de