KI im Alltag

Google Gemini: KI-Musik mit Lyria erstellen

Möchtest du für dein Urlaubsvideo eigene Hintergrundmusik erstellen? Oder für einen Geburtstag einen persönlichen Song mit passendem Text? Genau das verspricht Google mit der Musikfunktion in Gemini und dem Modell Lyria 3.

Nach Texten, Bildern und Videos ist nun Musik an der Reihe. Die Google-KI soll nicht mehr nur Inhalte analysieren, sondern kreativ für dich arbeiten. Doch wie gut funktioniert das wirklich? Ist das nur eine Spielerei oder ein ernstzunehmendes Werkzeug?

In diesem Artikel zeige ich dir Schritt für Schritt, wie du mit Google Gemini KI-Musik erstellst, was dabei gut funktioniert und wo die Grenzen liegen.

(Letzte Aktualisierung: 25.02.26)
Foto

Was ist Lyria und wie nutze ich es mit Google Gemini?


Mit Gemini kannst du ganz einfach einen Prompt eingeben und erhältst einen KI-Song. Hinter dieser Musikfunktion steckt das generative Musikmodell Lyria von Google DeepMind.

Was bedeutet das konkret? Du gibst eine Beschreibung in Form eines Textes mit Angaben zu Stil, Stimmung oder Thema ein. Die KI erzeugt daraus ein etwa 30 Sekunden langes Musikstück. Optional kann das Stück auch mit Gesang und einem automatisch generierten Songtext versehen werden. Zusätzlich wird ein passendes Coverbild erstellt.

Wichtig ist: Das Ganze richtet sich nicht in erster Linie an professionelle Musikerinnen und Musiker. Es ist vielmehr ein kreatives Werkzeug für Einsteiger, Content Creator oder neugierige Technikinteressierte.

Eine professionelle Musikproduktion mit ausgefeiltem Arrangement, Mixing und Mastering kann damit aktuell noch nicht ersetzt werden.


Schritt für Schritt: Deinen ersten KI-Song mit Gemini erstellen


Du benötigst Zugriff auf die Gemini-Weboberfläche. Die Musikfunktion steht nicht überall und nicht sofort zur Verfügung. Außerdem kann es sein, dass bestimmte Funktionen an ein Abonnement gekoppelt sind. Ich kann diese Funktion in Deutschland bereits nutzen.

Und so kannst du dir deinen ersten Song erstellen lassen:

Gemini Prompt KI-Musik
Musik Stile Gemini

Dieses ist nur ein Ausschnitt. Es gibt noch mehr ...

Icon KI-im-Alltag


Mein Beispielprompt lautet: „Ich sitze im Auto und fahre zur Arbeit. Schon wieder ein Stau. Beschwere dich über die vielen Autos.”

Und hier ist das Ergebnis:

Anschließend habe ich das noch mit einem deutschen Text erstellen lassen. Das war auch gut, die Sprache war einwandfrei. Es müssen also nicht immer englische Texte sein.

30 Sekunden für einen Song sind ziemlich kurz. Deshalb sollte die KI eine zweite Strophe hinzufügen. Das hat allerdings nicht geklappt.


So formulierst du einen wirklich guten Musik-Prompt


Wenn du mit Gemini oder einem anderen KI-Musiktool arbeitest, entscheidet dein Prompt maßgeblich über das Ergebnis. Wenn du deine Beschreibung möglichst genau machst, klingt der Song am Ende umso besser.

Google erklärt in dem Artikel ➥Richtig prompten mit Lyria 3, wie ein guter Prompt zur Musikgenerierung ausschauen sollte.

Hier die wichtigsten Punkte:

Genre und Ära möglichst konkret benennen: Wenn du einfach nur "Rock" schreibst, bekommt die KI viel zu viel Interpretationsspielraum. Rock ist richtig vielseitig. Von sanften Balladen bis hin zu aggressivem Metal ist alles dabei.

Beispiel: Alternative Rock der 2000er mit emotionalem Refrain, Hard Rock mit kraftvollen Riffs, Punk Rock, Alternative Rock mit eingängigem Refrain.

Je genauer du eine Epoche oder Stilrichtung eingrenzt, desto klarer weiß die KI, wie dein Song klingen soll.

Tempo und Rhythmus: Gib an, welches Tempo und welcher Rhythmus verwendet werden sollen. Beispiel: 120 BPM im klassischen 4/4-Takt. „Beats per Minute” (BPM) geben das Tempo eines Musikstücks an. Ein langsames Lied hat etwa 60-80 BPM, während Techno oder schneller Pop oft bei 120-150 BPM liegen.

Instrumente bewusst auswählen: Ohne genaue Vorgaben greift die KI häufig auf typische Standardinstrumente zurück. Wenn du einen besonderen Klang möchtest, solltest du das entsprechend formulieren.

Beispiele: schmutzige, verzerrte Bässe, warme, analoge Synthesizer, akustische Gitarre mit sanftem Hall, treibende Drum-Machine.

Beschreibe die Stimmfarbe: Gerade bei Songs mit Gesang spielt die Stimme eine zentrale Rolle. Wenn du hier keine Angaben machst, wirkt der Gesang oft austauschbar.

Beispiele: kristallklarer weiblicher Sopran, rau und kiesig klingender, gealterter Rocksänger, tiefer, warmer männlicher Bariton.

Lege das Thema des Songtexts fest: Sag der KI, worum es inhaltlich gehen soll. Das kann ganz klassisch oder auch sehr persönlich sein. Natürlich kannst du auch den Songtext selbst schreiben und vorgeben. Oder du lässt dir den Text von der KI vorschlagen und passt ihn an.

Musik aus Bildern erzeugen: Multimodale Prompts. Ein Prompt muss nicht nur aus Text bestehen. Du kannst auch ein Foto oder ein Video hochladen und Gemini bitten, einen passenden Song dazu zu erstellen.

Die KI analysiert dabei den visuellen Hintergrund, also Umgebung, Stimmung und Thema, und übersetzt diese Eindrücke in Musik.

Das funktioniert oft erstaunlich gut, ist aber nicht immer hundertprozentig treffsicher. Du solltest daher immer noch ein paar Hintergrundinformationen in Textform hinzufügen.


Qualität und Grenzen: Was erwartet dich bei Lyria?


Folgende Dinge sind mir aufgefallen:

Klangqualität: Für Social Media, kleine Projekte oder die private Nutzung ist die Qualität absolut in Ordnung. Für eine professionelle Veröffentlichung reicht sie in der Regel jedoch nicht aus.

Ich finde, der Sound wirkt oft etwas generisch. Man merkt, dass es sich um KI-Musik handelt.

Songtexte: Die Texte sind brauchbar, aber selten tiefgründig. Oft bestehen sie aus typischen Phrasen. Das kannst du aber selbst anpassen und verändern.

Technische Begrenzung: Aktuell sind die KI-Musikstücke meist nur etwa 30 Sekunden lang. Das reicht nicht aus, um einen ganzen Song zu erstellen. Bei mir hat es auch nicht funktioniert, eine zweite Strophe im gleichen Stil zu erzeugen.

Neben Gemini gibt es weitere Anbieter wie Suno oder Udio. Diese bieten teilweise längere Songs oder etwas ausgefeiltere Strukturen.

Der Vorteil von Gemini liegt in der Integration in die Google-Dienste und der einfachen Bedienung. Wer sich ohnehin mit Gemini beschäftigt, findet sich hier schnell zurecht.

Mehr zum Thema erfährst du in meinem Artikel ➥ KI-Musikgeneratoren: Die neuen Werkzeuge für Musiker?.


Sicherheit und Urheberrecht


Google kennzeichnet generierte Inhalte mit einem digitalen Wasserzeichen namens „SynthID”. Dieses ist nicht hörbar, dient aber zur Identifikation von KI-Inhalten.

Beim Thema Urheberrecht solltest du vorsichtig sein.

Die Verantwortung und das Risiko liegen am Ende bei dir.


Spielerei oder ernstzunehmendes Werkzeug?


KI-Musik mit Gemini und Lyria ist definitiv mehr als nur eine Spielerei. Sie ist ein spannender Einstieg in die Erstellung von KI-Musik. Gerade wenn du keine musikalische Erfahrung hast, kannst du hier schnell hörbare Ergebnisse erzielen. Auch wenn die meisten erkennen werden. dass die KI die Musik erstellt. hat.

Gleichzeitig darfst du keine Studioqualität erwarten. Die Songs sind kurz, oft etwas generisch und technisch begrenzt.

Mein Tipp: Probiere es aus! Erstelle ein paar Songs für private Projekte oder für Social Media und finde heraus, wie weit du mit guten Prompts kommst.

Vielleicht komponierst du deinen nächsten kleinen Soundtrack einfach selbst mit KI.

Und zum Schluss noch ein kleines Musikstück für mein nächstes Album mit Kinderliedern 🤣



Interessante Artikel zum Thema: KI-Musik


KI-Musikgeneratoren: Die neuen Werkzeuge für Musiker?

KI-Musik: KI-Musikgeneratoren und Auswirkungen auf die Musikproduktion. Was hält die Zukunft für musikalische KI-Innovationen bereit?

Mehr lesen



Zur Zeit gibt es noch keinen Kommentar zu diesem Thema. Das ist deine Chance 😉