Neue KI-Audio-Tools bei CyberLink: Text-to-Speech für Vlogger, Youtuber, Podcaster und Marketeers

myedit-stt-01-300x138 Neue KI-Audio-Tools bei CyberLink: Text-to-Speech für Vlogger, Youtuber, Podcaster und Marketeers

Taipeh, Taiwan — 12. März 2024 — CyberLink Corp. stellt jetzt für alle Content-Creator die Funktionen Text-zu-Sprache mit KI-Stimmengenerator und Sprache-zu-Text für unterschiedlichste Audio-Anwendungen vor. Bei Text-To-Speech (TTS) werden mit wenigen Angaben Texte in Sprache umgewandelt, der für Video-Content auf Youtube, Beschreibungen von Tutorials, Marketing- oder Lehrinhalten oder sogar Audiobooks dient. Dazu stehen realistische KI-Stimmen in verschiedenen Sprachen, Geschlechtern und Sprecharten zur Auswahl. Die KI-Funktion Speech-To-Text (STT) hilft bei Transkribieren sowie Vorlesen längerer Audio-Dateien und bietet die Möglichkeit Texte vom Audio ins Video zu integrieren. Ab sofort beim Online-Tool MyEdit sowie bei der App PowerDirector verfügbar.

Das Videomaterial ist aufgenommen oder fertig geschnitten, doch das Audio passt nicht zum Inhalt oder die Aufnahmequalität ist zu schlecht? Hier springt die KI ein und übernimmt das effektive Voice-Over mit realistischen Stimmen für unterschiedlichsten Video-Content.

Text-zu-Sprache in wenigen Schritten einfach generiert: Entsprechende Textdatei hochladen oder gewünschten Text eingeben, dazu eine der passenden KI-Stimmen, gewünschte Sprache sowie Sprechart – wie fröhlich, zornig oder ernst – je nach Anlass auswählen. Als Stimme stehen Mann, Frau sowie Kind zur Auswahl. Bei den Sprachen geht die Bandbreite von Deutsch, Englisch, Französisch sowie weiteren europäischen Sprachen bis Chinesisch sowie Japanisch. Anschließend kann das generierte Audio-Ergebnis kurz geprüft und direkt downgeloadet werden.

Die KI-Funktion Sprache-zu-Text wandelt Audiodateien zu Texten um, die passend im Video als beispielsweise als Untertitel eingeblendet werden. Oder es lassen sich aufgenommene Vorträge oder Podcasts einfach transkribieren und ausgeben als Textformat. Dazu einfach die Audiodatei hochladen (MP3, WAV, FLAC oder M4A), Sprache zur Ausgabe sowie Interpunktion auswählen, fertig ist der Text.

Online-Tool MyEdit & App PowerDirector: Versionen und Preise

Die neuen KI-Funktionen sind ab sofort bei MyEdit über den Browser oder in der App PowerDirector enthalten. Die neuen KI-Tools sind im erweiterten Funktionsumfang der jeweiligen Abo-Versionen bzw. per Zukauf von Credits (MyEdit) verwendbar.