Google geht den nächsten logischen Schritt in der Evolution seiner KI-Assistenten und macht aus Textbefehlen oder einfachen Schnappschüssen ab sofort fertige Songs. Was bisher spezialisierten Tools oder Profi-Produzenten vorbehalten war, landet mit der Integration des neuen Modells Lyria 3 direkt in der Gemini App.
Die Botschaft dahinter ist klar: Es geht nicht darum, den nächsten Chartstürmer am Reißbrett zu entwerfen, sondern den Nutzern ein spielerisches Werkzeug an die Hand zu geben, um Momente, Insider-Witze oder Erinnerungen musikalisch zu untermalen. Ob ein R&B-Song über eine verlorene Socke oder ein fröhlicher Afrobeat-Track als Dankeschön an die Mutter, die Hürden für die eigene Musikproduktion sind damit praktisch verschwunden.
Lyria 3 bringt mehr Komplexität und Kontrolle
Hinter der neuen Funktion steckt die neueste Generation von Googles Musikmodell namens Lyria 3, das von Google DeepMind entwickelt wurde. Im Vergleich zu seinen Vorgängern hat das Modell ordentlich dazugelernt. Eine der auffälligsten Neuerungen ist die automatische Textgenerierung. Nutzer müssen sich keine Zeilen mehr aus den Fingern saugen, da die KI basierend auf dem Prompt direkt passende Lyrics verfasst.
Zudem versprechen die Entwickler eine deutlich höhere musikalische Komplexität und realistischere Vocals. Wer möchte, kann gezielt Einfluss auf das Genre, das Tempo oder die Stimmung nehmen. Das Ergebnis sind 30 Sekunden lange Tracks, die zwar kurz, aber dafür handwerklich erstaunlich ausgereift wirken.
Hier mal ein kurzes Beispiel: Unser Prompt: ein Track zum Thema „MORE Magazine“ im Rock-Stil. Fokus-Thema Technik.
Pop Song zum Thema MORE Magazine; es soll den Fokus auf aktuelle Technik wie iPhones, Google Pixel und Consumer-Electronic legen.
Besonders spannend für die alltägliche Nutzung ist die Verknüpfung von Bild und Ton. Anstatt mühsam zu beschreiben, wie ein Song klingen soll, können Anwender einfach ein Foto oder ein Video hochladen. Gemini analysiert den Inhalt und die Stimmung des Mediums und komponiert darauf basierend ein passendes Stück.
Wer beispielsweise ein Bild von seinem Hund beim Wandern hochlädt, erhält einen Song, der genau diese Outdoor-Atmosphäre einfängt. Damit die Präsentation stimmt, generiert das Bildmodell Nano Banana direkt ein passendes Cover-Art dazu. Die fertigen Werke lassen sich über einen Link teilen oder direkt herunterladen, was die Hürde für den schnellen Versand im Freundeskreis minimiert.
Schutzmechanismen und digitale Wasserzeichen
In Zeiten von Deepfakes und Urheberrechtsdebatten legt Google gesteigerten Wert auf Sicherheit. Jeder Song, der mit Gemini erstellt wird, ist mit SynthID versehen. Dabei handelt es sich um ein digitales Wasserzeichen, das für das menschliche Ohr nicht wahrnehmbar ist, aber von entsprechenden Tools eindeutig als KI-generiert identifiziert werden kann. Zudem hat Google die Verifikationsmöglichkeiten innerhalb der App erweitert. Nutzer können nun Audio-Dateien hochladen und Gemini fragen, ob diese mit Google-KI erstellt wurden. Das System prüft dann nicht nur auf das Wasserzeichen, sondern nutzt eigene Logik, um die Herkunft des Materials einzuordnen.
Die Sorge der Musikindustrie, dass KI-Modelle bekannte Künstler einfach kopieren, ist groß. Google betont hierzu, dass Lyria 3 auf originellen Ausdruck ausgelegt ist und nicht darauf, existierende Stars zu imitieren. Wenn Nutzer versuchen, einen Track im Stil eines spezifischen Weltstars zu erzwingen, nimmt Gemini dies lediglich als grobe Inspiration für eine allgemeine Stimmung, statt die Stimme oder geschützte Melodien zu klonen.
Zudem sind Filter aktiv, die das Ergebnis gegen bestehende Inhalte abgleichen. Falls dennoch etwas durchrutscht, gibt es Melde-Mechanismen für Urheberrechtsverletzungen. Das Training des Modells fand laut Google in enger Abstimmung mit Partnern aus der Musikbranche statt, um rechtliche Fallstricke von vornherein zu minimieren.
Verfügbarkeit und Rollout-Plan
Die Musikfunktion startet ab dem 18. Februar 2026 als Beta-Version. Der Rollout beginnt sofort für die Desktop-Version von Gemini und wird in den kommenden Tagen auf die mobilen Apps ausgeweitet. Unterstützt werden zum Start mehrere Sprachen, darunter auch Deutsch, Englisch, Französisch und Japanisch. Nutzen können das Tool alle Anwender ab 18 Jahren.
Während die Basis-Version für alle offen steht, erhalten Abonnenten von Google AI Plus, Pro und Ultra höhere Nutzungslimits für ihre kreativen Experimente. Parallel dazu findet Lyria 3 auch seinen Weg in YouTube Shorts, wo Creator im Rahmen von Dream Track nun noch hochwertigere Soundtracks für ihre Kurzvideos erstellen können.
Ausprobieren kann man Lyria aktuell direkt in Gemini über den Web-Browser (LINK)
mehr zu Google
















