Audioproduktionen für Sprachdialogsysteme

Audioproduktionen für Sprachdialogsysteme
Interview mit Jonathan Buttmann und Christian Schneider, dynamic audio

VOICE Community: Welche Services bietet dynamic audio? Was sind Ihre
Aufgaben?

Christian Schneider: dynamic audio ist eine Fullservice-Audioagentur mit
integriertem Tonstudio. Der Schwerpunkt unseres Unternehmens liegt in der
Organisation und Erstellung von Sprachaufnahmen und Sounddesign für
Telefonsysteme. Durch unsere langjährige Zusammenarbeit mit Firmen aus diesem
Segment haben wir erkannt, dass Audioproduktionen für Telefonservices besondere
Anforderungen stellen, die in einem herkömmlichen Tonstudio in der Regel nicht
abgedeckt werden. Wir haben es uns daher zur Aufgabe gemacht, Kernbereiche wie
Konzeption, Sprechervermittlung, Sounddesign, Sprachregie und Sprachaufnahmen,
weitläufig abzudecken und unter einem Dach zusammenzufassen.

VOICE Community: Was sind die Aufgabenbereiche von dynamic audio im Voice-
Business?

Jonathan Buttmann: Als Fullserviceagentur versuchen wir schon frühstmöglich
beratend in den Produktionsprozess einzusteigen. Dabei unterstützen wir den
Kunden schon vor der eigentlichen Produktion, indem wir helfen, das richtige Hear &
Feel der Anwendung zu finden. Wir bieten individuelle Personakonzepte,
Sounddesignkonzepte für Wartemusiken, Audiologos und Navigationssounds, auf die
Persona abgestimmte und für Sprachanwendungen optimierte Texte, sowie
Unterstützung in der Planung der Widergabe von veränderlichen Datenbeständen.
Nachdem wir die Konzeptionsphase abgeschlossen haben, produzieren wir sämtliche
Audioinhalte mit professionellen Sprechern und erstellen das Sounddesign der
Anwendung. Zu guter letzt bereiten wir die Aufnahmen für den Telefonkanal auf und
konvertieren sie in die entsprechenden Formate. Der Kunde braucht somit nur noch
die Audiofiles in sein System einzubinden.

VOICE Community: Können Sie unseren Lesern kurz erklären, was genau unter
„Personakonzept“, „Sprachaufnahme“ und „Sounddesign“ zu verstehen ist?

Jonathan Buttmann: Das Personakonzept dient zur Beschreibung des virtuellen
Kommunikationspartners, der den User durch die Anwendung führt. Es beschreibt
z.B. das Stimmalter, die Sprechgeschwindigkeit, mögliche Dialekte, die Form der
Anrede – persönlich oder förmlich – usw. Es ist Vorlage und Leitfaden für die
Sprecherauswahl, das Texting, die Regieanweisungen, die Rolle des Sprechers bei
den Aufnahmen – und natürlich für die Abstimmung mit dem Endkunden.
Christian Schneider: Sprachaufnahmen umfassen die Aufnahme und
Nachbearbeitung der Sprachfiles, die später vom System wiedergegeben werden.
Und unter Sounddesign versteht man Audiologos, Wartemusiken, Jingles und
Navigationssounds beispielsweise bei Bestätigungen, Datenbankabfragen oder
Fehlermeldungen.

VOICE Community: Wozu braucht man Sounddesign in Sprachanwendungen?
Welchen Nutzen haben Soundlogos und Earcons?

Christian Schneider: Generell unterscheiden wir zwischen der informativen und der
emotionalen Funktion von Sounddesign. Durch Elemente wie Musik, Audiologo oder
Jingle wird z.B. die Marke und das Image eines Produkts transportiert.
Navigationssounds hingegen, die sogenannten Earcons, helfen dem Nutzer bei der
Navigation durch das System. Durch das Abspielen eines Soundloops bei einer
Datenbankabfrage z.B. wird dem Nutzer signalisiert, dass das System arbeitet und
nicht stehengeblieben ist. Letztendlich dient Sounddesign auch der
Benutzerfreundlichkeit, indem Wartezeiten überbrückt werden.

VOICE Community: Wozu brauche ich einen professionellen Sprecher und ein
professionelles Tonstudio – warum kann das nicht z.B. meine Sekretärin vor ihrem
Rechner aufnehmen?
(beide lachen)

Christian Schneider: Nein, das geht nicht. Allerdings werden wir häufig mit dieser
Frage konfrontiert.
Sprachaufnahmen und Sounddesign sind das Bindeglied zwischen Nutzer und
Anwendung. Sie stellen im übertragenen Sinne die Verpackung des Produktes dar.
Wir vergleichen diesen Punkt einfach immer wieder gerne mit einer Visitenkarte oder
Website eines Unternehmens. Hier würde man auch nicht am Text, Layout oder
Farbgebung sparen. Ein Tonstudio bietet in puncto Sprach- und Klanqualität einfach
wesentlich mehr als ein Großraumbüro mit Mikrofon am Computer.

Jonathan Buttmann: Selbst wenn die Sekretärin noch so eine bezaubernde
Stimme hat, sind die Anforderungen an professionelle Sprachaufnahmen nicht zu
unterschätzen. Von einem professionellen Sprecher erwarten wir, dass er schnell und
problemlos in verschiedene Rollen schlüpfen kann, dass er auch bei mehrtägigen
Aufnahmen und eintönigen Datenbergen konsistent in der Stimmung bleibt und ein
präzises Textverständnis hat, um die Betonungen richtig zu gestalten. Kurzum: Nicht
umsonst gibt es eine mehrjährige Schauspiel- und Sprechausbildung.

VOICE Community: Wo liegen die besonderen Herausforderungen bei
Sprachaufnahmen für Telefonsysteme?

Jonathan Buttmann: Ein Telefonsystem besteht meist aus vielen einzelnen
Audiodateien, die in unterschiedlichstem Kontext abgespielt werden können. Das
harmonische Zusammenspiel dieser einzelnen Dateien untereinander ist maßgebend
für ein gelungenes Hear & Feel. Stimmung und Persona müssen während der
gesamten Aufnahme kontinuierlich und den verschiedenen Anforderungen des
Systems entsprechend überwacht werden.

Christian Schneider: Auch das Einhalten von bestimmten Betonungsbögen ist
wichtig, damit der Nutzer die Keywords schnell und richtig versteht.

VOICE Community: Welche Techniken und Tools nutzen Sie für Ihre Arbeit?

Christian Schneider: Zum einen haben wir ein optimal akustisch und technisch
ausgebautes Studio für Sprachaufnahmen und Sounddesign. Auch wenn das
Frequenzspektrum des Telefons stark eingeschränkt ist, ist es notwendig vor der
Konvertierung mit bestmöglicher Qualität aufzuzeichnen. Nur so lassen sich gute
Ergebnisse bezüglich der Sprachverständlichkeit und Tonqualität erzielen, die einem
professionellem System gerecht werden.

Jonathan Buttmann: Darüber hinaus versuchen wir bereits vor der Aufnahme
einen umfassenden Überblick über das System zu bekommen, damit wir
konkatenierte Elemente so gut wie möglich vorbereiten können. Dazu muss auch
schon mal ein Textdokument umgestellt werden. Grade bei Daten, wie Zahlen oder
Uhrzeiten, gibt es verschiedene Techniken des Konkatenierens, um eine möglichst
natürlich sprachliche Ausgabe zu erreichen.

VOICE Community: Was bedeutet „konkatenieren“?

Christian Schneider: Unter Konkatenation versteht man die Verkettung von
Audiofiles. Sollte in einem System ein variables Datum wiedergegeben werden, wäre
es ein enormer Aufwand alle möglichen Datenvariationen aufzunehmen. Man
beschränkt sich daher auf die Aufnahme der einzelnen Variablen wie Tag, Monat und
Jahr. Diese werden dann vom System zusammengesetzt und nacheinander
abgespielt. Die Datumsausgabe „1.Januar 2010“ würde z.B. aus der Verkettung der
Einzeldateien „Erster.wav“ + „Januar.wav“ + „Zweitausendzehn.wav“ entstehen.

VOICE Community: Für welche Kunden arbeiten Sie?

Jonathan Buttmann: Seit Beginn sind wir Partner der Mundwerk AG, die später ein
Teil der Excelsis Gruppe wurde. Hier blicken wir auf eine langjährige erfolgreiche
Zusammenarbeit im Voice-Business zurück. Als exklusiver Audiodienstleister der
Excelsis haben wir schon mehrere hundert Applikationen aus den verschiedensten
Maktsegmenten vertont: Darunter Kunden in Deutschland wie IKEA oder T-Com, in
der Schweiz Cablecom, in Östereich ORF und im internationalen Markt RTA, das
Verkehrssystem von Dubai.
Christian Schneider: Zudem haben wir im Bereich Telefonie Projekte für die AOK
Sachsen/Berlin, Promarkt, Loxxess, Alazar und NH-Hoteles umgesetzt und
verschiedene Conferencing Systeme für Dysi/Lindenbaum und Meetingzone. Neben
dem Telefonmarkt bedienen wir verschiedene Kunden aus den Bereichen e-learning
und Werbung wie beispielsweise BSMO, V8-Film oder NH-University.

VOICE Community: Herr Buttmann, Herr Schneider, herzlichen Dank für das
Gespräch.
Das Interview führte Manja Baudis.
dynamic audio berlin
Fullservice-Audioagentur mit integriertem Tonstudio
dynamic audio versteht sich als Full Service Spezialist für Audioproduktionen im
Multimediabereich. Die Spezialität des Unternehmens sind angepasste
Audioproduktionen für den Wiedergabekanal Telefon, sowie die Planung und
Durchführung von konkatenierten Audioelementen (aus verschiedenen Bestandteilen
zusammengefügte Audiofiles). Neben Sprachaufnahmen und Sounddesign für
Telefonsysteme produziert dynamic audio auch individuell auf Unternehmen
zugeschnittene Klangwelten, Firmenmusiken, Audiologos und Radiospots. Das
Unternehmen vereint Kompetenzen aus den Bereichen Audio Engineering,
Sounddesign, Persona, Text und Konzeption, Linguistik, Sprachaufnahmen und
Sprachregie.
Das Kernteam des Unternehmens bilden der Projektmanager und Audio Engineer
Jonathan Buttmann und der Sounddesigner und Multimediaproduzent Christian
Schneider. Christian Schneider und Jonathan Buttmann arbeiten seit über 10
Jahren im Bereich der Vertonung von verschiedenen Multimediaprodukten. 2003
beschlossen sie gemeinsam die Firma dynamic audio zu gründen. Unterstützt wird
das Team durch ein breites Spektrum an freien Sprechern, Sounddesignern,
Textern, Konzeptern und Linguisten. dynamic audio verfügt über ein professionell
ausgestattetes Tonstudio, eine umfangreiche Soundlibary sowie einen großen,
mehrsprachigen Sprecherpool.
Zu den Kunden zählen unter anderen die BSMO, NH-Hotels, sowie die Kross
Werbeagentur. Zudem ist dynamic audio Partner der Mundwerk/Excelsis AG einem
der führenden Anbieter für Sprachdialogsysteme im deutschsprachigen Raum.