2016-12-05 E-Learning
Die E-Learning Produktion ist fast fertig, jetzt nur noch schnell die Sprachaufnahmen abmischen und fertig... Oder?
Dieser letzte Schritt kann komplexer sein, als man denkt. Denn Vertonung, Sounddesign und Postproduktion haben mit „mal nebenbei was abmischen“ nichts zu tun. Im Gegenteil: Ein schlechter Mix würde sogar die vielen Stunden Arbeit an deinem E-Learning ruinieren. Wie aber geht es richtig?
Die Sprache muss verständlich sein, dem ist alles andere unterzuordnen. Leidet die Verständlichkeit, leidet auch der Lernerfolg. Unser Tonmeister Jan-Felix Klein rät dazu:
„Sprachaufnahmen sollten nicht nur auf hochwertigen Studiomonitoren abgehört werden, sondern auch immer auf möglichst vielen anderen Geräten mit verschiedenen Boxen, wie z.B. Auto, Laptop, Smartphone, über Kopfhörer etc.”
Sein Tipp hilft, sicherzustellen, dass der Sound deines E-Learnings auf allen Anlagen gleich gut funktioniert.
So wie es bei Bildern beispielsweise Helligkeit, Kontrast und Farben gibt, gibt es auch beim Ton verschiedene Parameter. Die wichtigsten sind:
Wir versuchen, die Begriffe einfach zu erläutern und werden nicht zu sehr ins Detail gehen.
Noch nie gehört? Macht nichts.
Lautheit ist nicht gleich Lautstärke.
Die tatsächliche, empfundene Lautstärke hängt davon ab, wie laut deine Anlage aufgedreht ist (Schalldruckpegel) und wie das Aufgenommene klingt (Frequenzspektrum).
Ein sehr schrilles Signal wird lauter wahrgenommen als ein "angenehmes" Signal.
Die Lautheit hingegen ist messbar, noch bevor das Aufgenommene bei dir zu Hause abgespielt wird. Definiert wird dies z.B. mit der Einheit LU (Loudness Unit - falls es dich interessiert: basierend auf der Richtlinie EBU R128.)
Wie LUs genau definiert werden ist kompliziert, vereinfacht gesagt ist es aber empfundene Lautstärke über eine gewisse Zeitspanne, basierend auf Pegel (nicht Schalldruck!) und Frequenzspektrum.
Was ist denn nun wieder ein Pegel? Ganz einfach.
Eine digitale Audiodatei kann nur einen gewissen Pegel erreichen - mehr als "voll" geht nicht.
Hier spricht man von -0 dBFS, was so viel heisst wie "0 dB vom Maximum entfernt".
Das FS steht für Full Scale - bei -0dBFS ist die Skala voll. ;)
Die maximale mögliche Lautheit käme durch einen stetig maximalen Pegel zustande - nach einer menschlichen Stimme klingt das ganze dann aber nicht mehr.
Eine menschliche Stimme hat von Natur aus Lautheitsschwankungen - allein schon zwischen verschiedenen Buchstaben innerhalb eines Wortes.
Nun kann man die Unterschiede im Pegel (Dynamik!) reduzieren, zum Beispiel durch sogenannte Kompressoren. Das ist auch wünschenswert, da bei zu großen Unterschieden der Lautheit die Sprachverständlichkeit leidet - oder du sogar an der Anlage ständig lauter / leiser drehen musst.
„Hast du zum Beispiel schonmal einen Film im Free TV geschaut und dir sind bei der Werbeunterbrechung fast die Ohren weggeflogen, obwohl du an der Lautstärke des Fernsehers nichts geändert hast? Der Grund dafür ist, dass der Film eine andere Lautheit hat als die Werbespots in der Unterbrechung. ”
Eine zu hohe Lautheit (zu geringe Dynamik!) hingegen lässt dein Ohr ermüden, und es klingt nicht mehr natürlich.
Das richtige Maß finden ist also gefragt!
[TL;DR] Um es nochmal kurz und knackig zu erklären:
Dynamik bezeichnet den Unterschied zwischen lauten und leisen Passagen.
Bei zu viel Dynamik leidet die Textverständlichkeit und leisere Passagen werden allzu schnell unverständlich. Auf der anderen Seite ermüdet der Zuhörer schnell bei mangelnder Dynamik, weil es keine interessante Fluktuation im Sprachfluss gibt.
Der Lernende wird also entweder reizüberflutet oder durch eine monotone Stimme gelangweilt.
Der Frequenzgang bestimmt, ob die Stimme ausgewogen, blechern (zu viele Höhen) oder dumpf (zu wenig Höhen) klingt.
Deswegen ist in der Postproduktion darauf zu achten, dass der Klang konsistent und natürlich ist.
Hierzu wird die Sprachaufnahme in der Postproduktion mithilfe eines Equalizers so bearbeitet, dass sie auf allen Boxen abgespielt werden kann und bei der Wiedergabe als angenehm empfunden wird. Ist der Klang der Stimme zu dumpf, können beispielsweise tiefe Frequenzen abgeseknt oder hohe Frequenzen abgehoben werden.
Resonanzen im Raum können bedämpft werden. Im Klartext: durch die räumlichen Begebenheiten (z.B. einer Sprecherkabine) werden bestimmte Frequenzen überbetont. Diese können herausgefiltert werden.
Audiopostproduktion ist eine komplexe Angelegenheit. Solltest du jetzt ratlos vorm Bildschirm sitzen, können wir dich beruhigen: Tonmeister ist nicht umsonst ein eigenständiger Beruf. Vieles kannst du selber machen, wenn du nicht weiterkommst, helfen wir dir gerne
Dieser Text ist ein Ausschnitt aus unserem 24 seitigen E-Book "Der ultimative Guide zur E-Learning Vertonung" Hier geht es zum kostenlosen Download:
wundervoices GmbH • Rotter Bruch 17 • 52068 Aachen
Umsatzsteuer-Identifikationsnummer gem. § 27a UStG: DE322647562
Registergericht: Amtsgericht Aachen • Registernummer: HRB 22539
Vertretungsberechtigter Geschäftsführer: Alex Jacobi