E-Learning Videos - die Grundlagen zur perfekten Vertonung

    2016-12-05 E-Learning

    Die E-Learning Produktion ist fast fertig, jetzt nur noch schnell die Sprachaufnahmen abmischen und fertig... Oder?

    Dieser letzte Schritt kann komplexer sein, als man denkt. Denn Vertonung, Sounddesign und Postproduktion haben mit „mal nebenbei was abmischen“ nichts zu tun. Im Gegenteil: Ein schlechter Mix würde sogar die vielen Stunden Arbeit an deinem E-Learning ruinieren. Wie aber geht es richtig?

    Die Sprache ist das wichtigste Element.

    Die Sprache muss verständlich sein, dem ist alles andere unterzuordnen. Leidet die Verständlichkeit, leidet auch der Lernerfolg. Unser Tonmeister Jan-Felix Klein rät dazu:

    „Sprachaufnahmen sollten nicht nur auf hochwertigen Studiomonitoren abgehört werden, sondern auch immer auf möglichst vielen anderen Geräten mit verschiedenen Boxen, wie z.B. Auto, Laptop, Smartphone, über Kopfhörer etc.”

    Sein Tipp hilft, sicherzustellen, dass der Sound deines E-Learnings auf allen Anlagen gleich gut funktioniert.

    Die wichtigsten Schritte der Klangbearbeitung

    So wie es bei Bildern beispielsweise Helligkeit, Kontrast und Farben gibt, gibt es auch beim Ton verschiedene Parameter. Die wichtigsten sind: 

    • Lautheit
    • Dynamik 
    • Frequenzgang

    Wir versuchen, die Begriffe einfach zu erläutern und werden nicht zu sehr ins Detail gehen. 

    Lautheit

    Noch nie gehört? Macht nichts. 
    Lautheit ist nicht gleich Lautstärke.

    Die tatsächliche, empfundene Lautstärke hängt davon ab, wie laut deine Anlage aufgedreht ist (Schalldruckpegel) und wie das Aufgenommene klingt (Frequenzspektrum).
    Ein sehr schrilles Signal wird lauter wahrgenommen als ein "angenehmes" Signal. 

    Die Lautheit hingegen ist messbar, noch bevor das Aufgenommene bei dir zu Hause abgespielt wird. Definiert wird dies z.B. mit der Einheit LU (Loudness Unit - falls es dich interessiert: basierend auf der Richtlinie EBU R128.)
    Wie LUs genau definiert werden ist kompliziert, vereinfacht gesagt ist es aber empfundene Lautstärke über eine gewisse Zeitspanne, basierend auf Pegel (nicht Schalldruck!) und Frequenzspektrum.

    Was ist denn nun wieder ein Pegel? Ganz einfach.
    Eine digitale Audiodatei kann nur einen gewissen Pegel erreichen - mehr als "voll" geht nicht.
    Hier spricht man von -0 dBFS, was so viel heisst wie "0 dB vom Maximum entfernt".
    Das FS steht für Full Scale - bei -0dBFS ist die Skala voll. ;) 

    Die maximale mögliche Lautheit käme durch einen stetig maximalen Pegel zustande - nach einer menschlichen Stimme klingt das ganze dann aber nicht mehr. 

    Eine menschliche Stimme hat von Natur aus Lautheitsschwankungen - allein schon zwischen verschiedenen Buchstaben innerhalb eines Wortes. 

    Nun kann man die Unterschiede im Pegel (Dynamik!) reduzieren, zum Beispiel durch sogenannte Kompressoren. Das ist auch wünschenswert, da bei zu großen Unterschieden der Lautheit die Sprachverständlichkeit leidet - oder du sogar an der Anlage ständig lauter / leiser drehen musst.

    „Hast du zum Beispiel schonmal einen Film im Free TV geschaut und dir sind bei der Werbeunterbrechung fast die Ohren weggeflogen, obwohl du an der Lautstärke des Fernsehers nichts geändert hast? Der Grund dafür ist, dass der Film eine andere Lautheit hat als die Werbespots in der Unterbrechung. ”

    Eine zu hohe Lautheit (zu geringe Dynamik!) hingegen lässt dein Ohr ermüden, und es klingt nicht mehr natürlich.

    Das richtige Maß finden ist also gefragt!

    [TL;DR] Um es nochmal kurz und knackig zu erklären:

    • Lautheit beschreibt, dass zwei Sounds bei gleicher Anlagen-/Lautstärkeneinstellung unterschiedlich laut wirken.
    • Die tatsächlich empfundene Lautstärke definiert sich durch den Regler kombiniert mit Lautheit. Sprich: Lautheit mal Verstärkung.
    • Lautheit ist Pegel mal Zeit
      • Hier noch ein Beispiel: Ein lauter Klatscher hat weniger Lautheit, aber mehr Pegel als ein kontinuierlich gleichbleibender Ton. 

    • Und: je weniger Dynamik etwas hat, desto höher kann die Lautheit sein

    Dynamik

    Dynamik bezeichnet den Unterschied zwischen lauten und leisen Passagen.
    Bei zu viel Dynamik leidet die Textverständlichkeit und leisere Passagen werden allzu schnell unverständlich. Auf der anderen Seite ermüdet der Zuhörer schnell bei mangelnder Dynamik, weil es keine interessante Fluktuation im Sprachfluss gibt.

    Der Lernende wird also entweder reizüberflutet oder durch eine monotone Stimme gelangweilt. 

    Frequenzgang

    Der Frequenzgang bestimmt, ob die Stimme ausgewogen, blechern (zu viele Höhen) oder dumpf (zu wenig Höhen) klingt.

    Deswegen ist in der Postproduktion darauf zu achten, dass der Klang konsistent und natürlich ist. 

    Hierzu wird die Sprachaufnahme in der Postproduktion mithilfe eines Equalizers so bearbeitet, dass sie auf allen Boxen abgespielt werden kann und bei der Wiedergabe als angenehm empfunden wird. Ist der Klang der Stimme zu dumpf, können beispielsweise tiefe Frequenzen abgeseknt oder hohe Frequenzen abgehoben werden. 
    Resonanzen im Raum können bedämpft werden. Im Klartext: durch die räumlichen Begebenheiten (z.B. einer Sprecherkabine) werden bestimmte Frequenzen überbetont. Diese können herausgefiltert werden. 

    Fazit

    Audiopostproduktion ist eine komplexe Angelegenheit. Solltest du jetzt ratlos vorm Bildschirm sitzen, können wir dich beruhigen: Tonmeister ist nicht umsonst ein eigenständiger Beruf. Vieles kannst du selber machen, wenn du nicht weiterkommst, helfen wir dir gerne 

    Dieser Text ist ein Ausschnitt aus unserem 24 seitigen E-Book "Der ultimative Guide zur E-Learning Vertonung" Hier geht es zum kostenlosen Download:

     

    E-Book Download

    Reader comments

    Join the talk