Inhalt
Überblick über die Herausforderungen und Möglichkeiten, Text in KI generierten Bildern darzustellen.
Eine der Anwendungen von KI ist die Erzeugung von Bildern und Designs, die auf natürlichen Sprachen basieren, sogenannten Prompts.
Doch was ist, wenn du stattdessen einen Text in dem Bild oder dem Design haben möchtest? Das wird schwierig! Schau dir an, wie die Ergebnisse oft aussehen und warum die KI-Bild-Generatoren die Texte verstümmeln. Es gibt allerdings auch Ausnahmen!
(Letzte Aktualisierung: 20.03.24)Inhaltsverzeichnis und Beispiele
Einleitung | Copilot | Leonardo.ai | Firefly | Stable Diffusion | Dreamstudio | Ideogram | Microsoft Designer | Canva | Fazit und Ergebnisse | Kommentare
Texte in Bildern und Designs können beispielsweise Slogans, Namen oder Überschriften sein. Bestimmt hast du das schon einmal ausprobiert und der Text auf dem Bild war verstümmelt oder es gab Rechtschreibfehler. Hier ein Beispiel für einen misslungenen Text:
Schlechtes KI-Bild von DALL-E: Text auf Buchcover
Die Darstellung von Texten in KI generierten Bildern und Designs ist schwierig, weil Texte eine gewisse Komplexität aufweisen, die meist nicht von den KI-Modellen erfasst werden kann.
Zum Beispiel kann die Wahl der Wörter, der Schriftart, der Farbe oder der Position des Textes einen großen Einfluss auf die Botschaft und den Ton des Bildes oder des Designs haben.
Texte in Bildern und Designs müssen sowohl mit dem Hintergrund als auch mit der Zielgruppe und der gewünschten Botschaft übereinstimmen. Zum Beispiel muss ein Text in einem Plakat für eine Kampagne anders gestaltet sein als ein Text in einem Comicstrip oder einer Geburtstagskarte. Die KI muss also den Kontext und die Zielgruppe des Bildes oder des Designs verstehen und den Text entsprechend generieren.
Ich habe einige KI-Bildgeneratoren getestet und die Ergebnisse kannst du dir hier anschauen. Halte durch, am Ende siehst du noch ein paar brauchbare Beispiele.
Die Aufgabe, bzw. der Prompt ist: Erstelle ein Buchcover mit dem Titel: Künstliche Intelligenz im Alltag.
Das Bild, das mit Copilot generiert hat, sieht auf den ersten Blick gut aus. Es wurde allerdings kein Buchcover erstellt, sondern es ist ein Buch zu sehen. Der Text ließ sich auch mit gutem Zureden nicht in deutscher Sprache auf das Cover bringen. Den dargestellten Roboterkopf haben wir auch schon oftmals gesehen und alles zusammengenommen ist nicht sehr kreativ.
Meine Bewertung:
Kategorie | Bewertung |
---|---|
Textqualität | gut |
Textinhalt | schlecht, da nur englisch |
Kreativität | mittelmäßig |
Fazit | durchgefallen |
Mehr über den Image Creator von Bing, bzw. Copilot findest du in meinem Artikel: ➥ Bing Image Creator - KI-Bilder erstellen.
Auch hier wieder der typische Roboterkopf in einem futuristischen Stil. Der dargestellte Text in dem Design ist nicht lesbar. Das Ergebnis unterscheidet sich nicht wesentlich von dem vorherigen Beispiel.
Meine Bewertung:
Kategorie | Bewertung |
---|---|
Textqualität | schlecht |
Textinhalt | schlecht, nicht lesbar |
Kreativität | mittelmäßig |
Fazit | durchgefallen |
Eine der schlechtesten Umsetzungen. Ein Buchcover ist nicht zu erkennen. Die Hintergründe und Motive sind die üblichen, wie sie KI-Bildgeneratoren zu dem Thema Künstliche Intelligenz generieren. Kannst du den generierten Text erkennen? Er ist so gut wie nicht lesbar und zudem kryptisch.
Meine Bewertung:
Kategorie | Bewertung |
---|---|
Textqualität | schlecht |
Textinhalt | schlecht |
Kreativität | schlecht |
Fazit | komplett durchgefallen |
Wie auch bei den bisher genannten KI-Bildgeneratoren ist die Schrift nicht lesbar und es lässt sich vielleicht erahnen, was der Text bedeutet. Es wird ein Buch abgebildet und kein Cover. Die Grafik ist nicht besonders kreativ und könnte auch für einen Roman über den Urlaub an der See herhalten.
Meine Bewertung:
Kategorie | Bewertung |
---|---|
Textqualität | schlecht |
Textinhalt | schlecht |
Kreativität | schlecht |
Fazit | durchgefallen |
Mehr über Stable Diffusion kannst du in meinem Artikel: ➥ Stable Diffusion: So erstellst du eindrucksvolle KI-Bilder nachlesen.
Das Motiv ist, wie so oft, ein Kopf im futuristischen Stil. Also nicht sehr einfallsreich. Der Text ist nicht lesbar und recht klein. Es sieht mehr wie ein Plattencover aus, nicht wie ein Buchcover.
Meine Bewertung:
Kategorie | Bewertung |
---|---|
Textqualität | schlecht |
Textinhalt | schlecht |
Kreativität | mittel |
Fazit | durchgefallen |
Ich hatte die Hoffnung schon aufgegeben, dass die KI ein vernünftig aussehendes Buchcover mit dem Text „Künstliche Intelligenz im Alltag“ erstellt. Bis ich Ideogram.ai ausprobiert habe. Eine gelungenere Umsetzung finde ich. Hast du den Schreibfehler bei dem Wort „Intelligenz“ bemerkt.
Der Text ist lesbar, das Buchcover ist ein wenig origineller, als der sporadisch abgebildete Roboterkopf und insgesamt kann das Ergebnis sich sehen lassen. Was meinst du?
Wenn du es selbst einmal ausprobieren möchtest oder sehen willst, was für Bilder generiert werden, schau dir die ➥Website von ideogram an.
Meine Bewertung:
Kategorie | Bewertung |
---|---|
Textqualität | gut |
Textinhalt | fehlerhaft |
Kreativität | gut |
Fazit | halb bestanden |
Wie wir an den bisher genannten Beispielen sehen können, sind die KI-Bild-Generatoren nicht dafür geeignet einen vernünftigen Text innerhalb eines Bildes darzustellen. Ausnahme ist hier ideogram.ai, allerdings mit Abstrichen.
Also müssen wir wohl selbst etwas Hand anlegen und das Grundgerüst durch die KI erstellen lassen. Wie das geht, erfährst du jetzt.
Bei dem KI-Designer von Microsoft lässt du dir einen Vorschlag erstellen. Du gibst wie gewohnt deinen Text, bzw. Prompt ein. Als Ergebnis erhältst du einige Designvorschläge.
Du wählst eines der vorgeschlagenen Designs aus und kannst dies anschließend weiterbearbeiten. Du hast also den Text selbst in der Hand und der Designer übernimmt die Gestaltung des Bildes. Zusätzlich gibt es die Option davon Varianten zu erstellen.
Die Kreativität hält sich auch in Grenzen und wir haben solche Abbildungen schon hunderte Male im Internet gesehen. Und so schaut es dann aus:
Eine Übersicht über die Funktionen und die Einrichtung findest du in meinem Artikel: ➥ Microsoft Designer mit künstlicher Intelligenz.
Meine Bewertung:
Kategorie | Bewertung |
---|---|
Textqualität | gut |
Textinhalt | gut |
Kreativität | mittel |
Fazit | brauchbar |
Mein Favorit ist Canva. Hier hast du viele Gestaltungsmerkmale zur Auswahl und zusätzlich einige KI-Apps, die du einbinden kannst. Du wählst aus einer Menge an Vorlagen dein Design aus und passt es entsprechend an.
Die Bilder dazu kannst du auswählen oder dir von der KI anfertigen lassen. Ich muss allerdings erwähnen, dass die Hauptarbeit bei dir liegt und die KI nur ein wenig unterstützt.
Zugegeben, das Titelbild ist auch nicht sehr einfallsreich, aber die Schrift hat ein gewisses Etwas.
Hier noch der Link zur ➥Website von Canva.
Meine Bewertung:
Kategorie | Bewertung |
---|---|
Textqualität | sehr gut |
Textinhalt | gut |
Kreativität | gut |
Fazit | meine Empfehlung |
Ich meine, dass die KI-Bild-Generatoren noch nicht so weit sind, den Text vernünftig in die Bilder und Designs zu integrieren. Das liegt zum großen Teil an der Technologie, wie KI-Bilder generiert werden.
Vereinfacht gesagt, basieren die KI-Bildgeneratoren auf einer Methode des maschinellen Lernens, auch generatives Modell genannt. Dieses Modell lernt aus einer großen Menge von Daten. In unserem Fall sind das zum größten Teil Bilder und Texte, die diese Bilder beschreiben.
Grundlagen, die verwendet werden, sind verschiedene Quellen, wie beispielsweise Bilder im Internet, öffentliche Bildarchiven oder Kunstwerke. Je mehr und je vielfältiger die Daten sind, desto besser kann das Modell lernen, wie Bilder aussehen und wie sie mit Worten beschrieben werden können.
Das Problem ist nun, dass das generative Modell nicht nur lernt, wie Bilder und Texte aussehen, sondern auch versucht, neue Bilder und Texte zu erzeugen, die es noch nie zuvor gab.
Das Modell muss nicht nur die visuellen Elemente eines Bildes berücksichtigen, sondern auch die logische Struktur und den semantischen Sinn des Textes. Außerdem muss es darauf achten, dass der Text auf dem Bild gut lesbar, sichtbar und ansprechend ist.
Die heutigen KI-Bildgeneratoren sind noch nicht in der Lage, all diese Dinge zu beherrschen. Sie machen oft Fehler bei der Generierung von Text, wie z. B. falsche Schreibweise, Grammatik, Formatierung oder Positionierung. Oftmals ergeben die erzeugten Texte keinen Sinn oder passen nicht zum Bildkontext.
Das liegt daran, dass das Modell die Bedeutung und den Zweck des Textes nicht wirklich versteht, sondern nur versucht, ihn aus statistischen Mustern in den Daten nachzuahmen.
Es bleibt dir also nichts anderes übrig, als den Text selbst zu erstellen. Das Design kann, wie wir gesehen haben, von der KI erstellt werden. Ich finde es auch gut, dass die menschliche Kreativität hier gefragt ist und nicht alles der KI überlassen wird.
Was meinst du zu diesem Thema und hast du eine ähnliche Erfahrung gemacht? Schreib es in die Kommentare. Ich würde mich freuen
Die besten KI Bildgeneratoren: Vor- und Nachteile. Ein Vergleich.
Eine Übersicht über die besten KI-Bildgeneratoren. Finde den Bildgenerator, der zu dir passt. Ein ...
Weiter lesen ..
KI-Avatar-Videoerstellung: Tipps, Tricks und Anwendungsfälle
Erfahre mehr über Techniken zur Erstellung von Avatar-Videos mithilfe von künstlicher Intelligenz. Tipps, Vor- und Nachteile, sowie ...
Weiter lesen ..
Stable Diffusion: So erstellst du eindrucksvolle KI-Bilder
Was ist eigentlich Stable Diffusion und wie kann ich damit gute Bilder generieren? Beispiele und eine Einführung in das ...
Weiter lesen ..
Marco
vor 3 Monaten
Danke für diesen Beitrag! Die Erklärung für die (mangelnde) Qualität der Texte ist sehr hilfreich. Gibt es eine Möglichkeit, Bilder ohne Text zu erstellen? Bei mir funktioniert das nicht einmal, wenn ich es explizit in den Prompt schriebe, zumindest bei Dall-E nicht ...
Burkhard
vor 3 Monaten
Das geht mir auch so, dass die Anweisung "schreibe keinen Text" ignoriert wird. Da hilft nur, den Prompt komplett zu ändern und zu überlegen, welche Anweisung die KI wohl genommen hat, um einen Text hinzuzufügen.
LOST
vor 6 Monaten
Hallo, ich war schon eine Weile unterwegs herauszubekommen warum die Grafiken teilweise sehr stimmig und optisch teilweise bombastisch sind,aber der Name auf der Geburtstagstorte nicht einmal vernünftig geschrieben wird.Ich dachte es benötigt eine spezielle Schreibweise um sie fehlerfrei darzustellen,manchmal klappt es ja nach der 20ten Torte :-) .Deine Ausführungen haben mir sehr geholfen,Danke
Burkhard
vor 6 Monaten
Es freut mich, dass der Artikel dir geholfen hat. Viel Erfolg weiterhin bei deinen KI-Bildern und den Texten.