KI Musik auf dem nächsten Level?! – MusicGen von Meta kann jedes Genre
Eine neue KI der Facebook-Macher Meta namens MusicGen erzeugt Sounds und Loops direkt durch Texteingabe. Dazu kannst du die KI außerdem mit Aufnahmen existierender Melodien füttern. Und zusammen mit dem Prompt baut MusicGen dann ein Stück Musik mit der Melodie! Das Ganze funktioniert sogar auf Deutsch! Aufregende Zeiten brechen an.
MusicGen erzeugt 12 Sekunden Songs aus jedem Genre
Im Vergleich zu Riffusion klingen die Ergebnisse von MusicGen eine ganze Ecke realistischer. Die KI wurde mit gut 20.000 lizenzierten Songs trainiert, davon gut 10.000 „hochwertige“ Songs und 10.000 weitere aus Stock-Music-Librarys von Shutterstock und Pond5 (via Caschys Blog). Dementsprechend darfst du hier keine fertigen Hits erwarten. Denn das Trainingsmaterial basiert eben nicht auf kommerziellen Hits!
Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Aber die KI von MusicGen arbeitet so effizient (auch im Vergleich zur KI von Googles MusicLM), dass sie im Schnitt 30 bis 40 Sekunden nach der Eingabe eines Prompts ein Ergebnis ausspuckt. Und hier gibt es direkt bei der KI-Community von Hugging Face kostenlos online eine Möglichkeit MusicGen auszuprobieren. Wir können bestätigen: Die KI versteht auch Deutsch!
Genres kombinieren und mit eigenen Melodien Arien schreiben
Wer hat nicht schon immer davon geträumt, eine Kombination aus Jazz, Schlager und Grindcore zu erfinden? Oder Songs im Stil von Kraftwerk auf dem Xylophon zu schreiben? All das ist mit dem richtigen Prompt (so nennt man Befehle in der KI Welt) mit MusicGen möglich. Dazu kannst du auch kurze Schnipsel eigener Melodien hochladen und zusammen mit einem passenden Prompt die KI kleine Arien erzeugen lassen. Melodie pfeifen und aufnehmen, hochladen – fertig ist die Mozart-Oper mit der eigenen Melodie!
Einige Einschränkungen gibt es bei dem Tool allerdings schon. So fehlen Stimmen. Hier scheint sich Meta einfach absichern zu wollen, was urheberrechtliche Fragen betrifft. Auch gibt es in der Online-Demo von MusicGen keine Möglichkeit, längere Musikstücke zu erzeugen. Und du hast zwar die Möglichkeit, jeden Musikschnipsel herunterzuladen. Aber beim Modell auf Hugging Face geht das nur im Video-Format MP4. Und das kommt nur in Mono und mit einer Sample-Rate von 32 kHz. Zum Vergleich: Audiomaterial in DAWs hat mindestens eine Sample-Rate von 44,1 kHz. Aber es dürfte nicht mehr weit sein zur Musikmaschine!
Infos über MusicGen und KI
- Mehr über Meta
- Website bei Github mit allen Details zum Modell
- MusicGen bei Hugging Face zum Ausprobieren
- Vergleich mit anderen KI Musikmodellen
Videos
Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.