Voice-Cloning – Klingt mein Avatar wie ich?

Part 3 aus meiner Avatar-Video-Reihe

Stell Dir vor, Du musst für Sprachaufnahmen nicht ins Tonstudio gehen. Und auch nicht in Dein Podcast-Mikro sprechen. Du gibst einfach einen Text auf einer Voice-Cloning-Plattform ein und nur wenig später kannst Du eine fertige Audio-Datei mit Deiner Stimme herunterladen. Fertig ist Dein Text-to-speech-Produkt.

Dahinter steckt eine Technik, die es ermöglicht, die Stimme eines Menschen zu imitieren, indem sie aus Sprachaufnahmen ein künstliches Modell erstellt. Voice-Cloning-Plattformen helfen Dir, indem Sie Vorgaben machen: etwa, wie lange und welche Texte Du sprechen sollst, damit Dein Voice-Clon gelingt. Ich habe zum Beispiel das gesamte Audiomaterial aus meiner Studioaufzeichnung für meine Avatar-Videoreihe hochgeladen.

Sprach-Genie

Ein geniales Feature ist die große Auswahl an Sprachen. Mit einem Klick erhält man seinen Text in einer anderen Sprache. ElevenLabs etwa bietet derzeit 32 Sprachen für seine Text-to-Speech-Technologie an. Die Sprachenpalette umfasst unter anderem Portugiesisch, Spanisch, Französisch, Hindi, Deutsch, Japanisch, Arabisch, Koreanisch, Italienisch, Tamil und Schwedisch. Das Angebot wird stetig erweitert.

Meine Learnings aus der Voice-Cloning-Produktion

Wenn die Algorithmen Deine Audio-Daten ausgewertet haben, steht Dir Dein Stimmavatar in der Bibliothek zur Verfügung – wo Du auch Zugriff auf etliche Stimmen „von der Stange “ hast. Jetzt brauchst Du nur noch einen Text einzugeben, Deine Stimme auswählen  und schon kannst Du Dir den gesprochenen Text anhören. Wenn Dir die Betonung oder der Klang nicht gefällt, kannst Du mit den Settings Einfluss nehmen. Dieser Einfluss ist allerdings nicht sehr präzise und beruht weitestgehend auf Trial and Error. Dies ist ein Faktor im ganzen Prozess, der Zeit kosten kann.
Das Bild unten zeigt einen Ausschnitt der ElevenLabs-Bibliothek und rechts die Settings.

Bedenke Datenschutz und Ethik

Vor allem im Hinblick auf die missbräuchliche Verwendung von Voice-Cloning für Betrug oder Identitätsdiebstahl gibt es Bedenken. Datenschutz ist ein weiteres kritisches Thema. Wenn Du Deine Stimme für das Cloning bereitstellst, sollten Du Dir  bewusst sein, dass Deine Audiodaten potenziell von Dritten genutzt oder gespeichert werden können. Stelle sicher, dass Du nur vertrauenswürdige Anbieter verwendest, die klare Richtlinien zum Umgang mit persönlichen Daten haben. Vor der Nutzung solltest Du die die Datenschutzerklärungen genau durchlesen und Dich über die Speicherung und Weiterverwendung Deiner Sprachaufnahmen informieren.