Inhalt
Mit der Einführung von Stable Audio Open hat Stability AI ein Werkzeug geschaffen, mit dem du Audioclips, wie Drumbeats, Riffs und Umgebungsgeräusche erzeugen kannst. Sicherlich gibt es viele solcher Audiosamples im Internet, aber jetzt hast du die Möglichkeit mit deinem Text, diese individuell zu erzeugen.
(Letzte Aktualisierung: 26.07.24)Stable Audio Open ist ein Open-Source-Modell, das speziell für die Erstellung kurzer Audiosamples, Soundeffekte und Produktionselemente entwickelt wurde. Mit diesem Modell können Nutzerinnen und Nutzer bis zu 47 Sekunden lange Audioclips generieren. Wie gewohnt machst du das mit Hilfe eines Prompts, bzw. Texteingabe.
Das verwendete KI-Modell eignet sich besonders gut für die Erstellung von Drumbeats, Instrumentenriffs und Umgebungsgeräusche.
Es handelt sich hierbei um Open-Source. Du kannst das also lokal betreiben. Hierfür steht die Python-Bibliothek „stable-audio-tools“ zur Verfügung, die auf PyTorch basiert. Mit dieser Bibliothek kannst du eine eigene Oberfläche zur Generierung von Audio aus Text erstellen. Herunterladen kannst du das auf der ➥Seite von Huggingface. Dort findest du auch die Installationsanleitung.
Bei Huggingface kannst du Stable Audio Open einmal ausprobieren. Die Benutzeroberfläche ist wie immer einfach. Du gibst deinen Text ein, was erstellst werden soll und hast noch ein paar Regler, um das Ergebnis anzupassen. Den Prompt solltest du in englischer Sprache eingeben.
Audioclips generieren mit Stable Audio Open (Huggingface)
Meine Ergebnisse, die ich erzielt habe, waren unterschiedlich. Zum Teil sehr schlecht und zum Teil brauchbar. Richtig gut war nichts. Bei deiner Texteingabe solltest du folgendes beachten, sonst erhältst du meistens etwas ganz anderes:
Du musst nicht, wie bei ChatGPT sagen, dass die KI dieses oder jenes tun soll. Also nicht „Generate oder Create“. Beschreibe einfach nur, was du haben willst, zum Beispiel: „Car traffic in the big city“. Bessere Ergebnisse erzielst du, wenn du nur eine Sache generieren lässt, beispielsweise „Bird singing in the forest“ oder „Piano music in a bar”. Später kannst du die Audiospuren ja zusammenführen.
Jetzt bist du sicherlich gespannt, was bei mir herausgekommen ist. Hier die zusammengesetzten Audiospuren (Vogelgezwitscher, Piano-Bar-Musik und Autos, die vorbeifahren):
Während Stable Audio Open sich auf die Erzeugung kurzer Audiosamples konzentriert, bietet Stable Audio 2.0 eine umfassendere Lösung für die KI-Musik-Erstellung. Stable Audio 2.0 kann vollständige Musiktitel mit einer Länge von bis zu drei Minuten erzeugen. Darüber hinaus unterstützt es Audio-zu-Audio-Generierung, bei der du vorhandene Audiodateien hochladen und mithilfe von Textprompts in eine Vielzahl von Klängen verwandeln kannst. Mehr über Stable Audio erfährst du in meinem Beitrag: ➥ Stable Audio: KI-Musik kostenlos generieren.
Das Training von Stable Audio Open erfolgte auf Audiodaten von Freesound und dem Free Music Archive. Dies soll gewährleisten, dass die Rechte der Urheber respektiert werden.
Stable Audio Open ist ein Schritt in Richtung einer offenen und zugänglichen KI-Audioproduktion. Es bietet dir ein Werkzeug, um deine Audio-Projekte zu erweitern und neue Klänge hinzuzufügen.
Den Ansatz finde ich gut, allerdings ist die Qualität der generierten Audiodateien nicht sehr gut. Mal schauen, ob sich das noch ändern wird. Oder hast du andere Erfahrungen gemacht? Schreib es mir in die Kommentare. Ich würde mich freuen.
Artikel zu dem gleichen Thema
udio.com: KI-Musik kostenlos erstellen. Inklusive Gesang und Texten.
Mit udio.com erstellst du durch einen Prompt deine eigenen KI-Musikstücke. Kostenlos und in guter Qualität.
Stable Audio: KI-Musik kostenlos generieren
Erstelle mit Hilfe der Künstlichen Intelligenz einen bis zu 3 Minuten langen Song. Gib deinen Prompt ein, wähle den Stil und schon geht es los.
KI-Musikgeneratoren: Die neuen Werkzeuge für Musiker?
KI-Musik: KI-Musikgeneratoren und Auswirkungen auf die Musikproduktion. Was hält die Zukunft für musikalische KI-Innovationen ...
Weiter lesen ..
Zur Zeit gibt es noch keinen Kommentar zu diesem Thema. Das ist deine Chance 😉