Spotify setzt auf KI: Podcasts in anderen Sprachen, aber mit der Originalstimme
Spotify experimentiert derzeit mit einer KI-getriebenen Übersetzungstechnologie für Podcasts. Das Besondere: Während der Inhalt in eine andere Sprache übersetzt wird, bleibt die charakteristische Stimme des Podcast-Moderators erhalten. Schon im Mai 2023 gab es Gerüchte, dass Spotify an KI-Tools arbeitet, um die Stimmen von Podcast-Hosts zu "klonen".
Für diese innovative Übersetzungsfunktion greift Spotify auf das Transkriptionswerkzeug Whisper von OpenAI zurück. Dieses Tool, das mit einer beeindruckenden Menge an Audiodaten geschult wurde, zeigt auch bei deutschen Audioinhalten seine Stärken. Es kann nicht nur Sprache in andere Sprachen übersetzen, sondern auch die authentische Stimme der Sprecher mit hoher Genauigkeit reproduzieren.
Einige Podcast-Episoden, darunter der „Lex-Fridman-Podcast“ und „The Diary of a CEO“, wurden als Demonstrationsmaterial bereits ins Spanische übertragen. Inhalte in Französisch und Deutsch sollen bald folgen. Spotify hat die Ergebnisse in einem "Voice Translations Hub" zusammengefasst, der regelmäßig mit neuen Beiträgen versorgt wird.
Und für alle Online-Marketer da draußen: Wer weiß, vielleicht wird diese Technologie entweder das nächste "billige Gimmick" in der Werbewelt oder sie revolutioniert die Art und Weise, wie wir mit internationalen Zielgruppen kommunizieren. Nur die Zeit wird es zeigen!