Audio - Grundlagen
zur übergeordneten Seite
 

zum Seitenanfang
Sound-Optimierung speziell fürs Web
einen Abschnitt zurückeinen Abschnitt weiter
Sound im Web Sounds für das Web sollten möglichst klein und von maximaler Qualität sein. Da beides gemeinsam nicht geht, besteht die Kunst der Soundbearbeitung darin, möglichst geschickt einen Kompromiss zu realisieren, der sich bei geringem Speicherbedarf qualitativ hochwertig anhört.
Mono/Stereo In den meisten Fällen wird ein Monosound völlig ausreichen - du sparst ohne Qualitätseinbußen etwa 50% Speicherplatz.
Frequenzgang Schneide Bässe unterhalb etwa 50 Hz ab und hebe dafür die Frequenzen bis 100 Hz im Equalizer etwas an.
Im Bereich 2000 - 7000 Hz befindet sich die menschliche Stimme; wird dieser Bereich betont, wirkt der Sound klarer und brillianter.
Höhen benötigen besonders viel Speicherplatz, senke den Bereich über 10000 Hz etwas ab, damit sich der Sound besser komprimieren läßt.
Bei reinen Sprachaufnahmen kann der Frequenzbereich stärker beschnitten werden.
Normalisieren Beim Normalisieren wird die Lautstärke des gesamten Samples so weit angehoben, bis die lauteste Stelle die maximal mögliche verzerrungsfreie Lautstärke hat (0 dB).
Audio-Kompression

Beim Normalisieren zwingt eine einzige Spitze das gesamte Sample auf eine niedrigere Lautstärke. Bei der Audio-Kompression wird die Dynamik (= Differenz zwischen lautester und leisester Stelle) durch prozentuale Absenkung der lautesten Stellen gesenkt.
Wird anschließend nochmal normalisiert, ist das gesamte Sample deutlich lauter geworden.
Wie stark sich die Dynamik reduzieren lässt,ohne das es deutlich schlechter klingt, musst du durch Probieren herausfinden.

  Falls du dein Sample nicht für das Web, sondern für eine CD oder den Hörfunk produziert hast, bist du jetzt bereits fertig. Für die Verwendung im Web muß die Dateigröße jedoch noch drastisch reduziert werden:
Lautstärke Nachdem Frequenzgang und Dynamik optimiert sind, kann die Lautstärke, die nach dem Normalisieren maximal ist, abgesenkt werden. Der Sound ist dann nicht so aufdringlich und es kommt nicht gleich zu Verzerrungen, wenn mehr als ein Sound gleichzeitig läuft.
Abtastrate (Samplerate) Senke jetzt die Abtastrate von 44 kHz (CD-Qualität) auf 22 kHz (Kassette) oder 11 kHz (Radio). Da alle Frequenzen oberhalb der halben Abtastrate stark verfälscht werden, solltest du den Frequenzgang bereits entsprechend beschnitten haben oder jetzt ein Anti-Aliasingfilter verwenden.
Durch diese Maßnahme verringert sich das Datenvolumen auf 50 - 25%.
Auflösung (Bitrate) Wenn du jetzt die Auflösung von 16 Bit auf 8 Bit reduzierst, sparst du nochmals 50% Speicherplatz.
Höre dir deine Aufnahme immer wieder zur Probe an, damit du merkst, wann du des Guten zuviel getan hast.
MP3-Encodierung Zu guter Letzt solltest du das Wave-File in ein MP3-File konvertieren, damit reduziert sich das Datenvolumen nochmals etwa um den Faktor 10 . Versuche es mit einer Komprimierung auf 24 kBit/s oder weniger (anhören!).
Besonderheiten bei Sprache Da das Ohr sehr empfindlich auf die Verfälschung einer bekannten Stimme reagiert, solltest du bei Sprachsamples besonders sparsam mit der Audio-Kompression arbeiten.

zum Seitenanfang
Etwas Physik: Töne - analog und digital
einen Abschnitt zurückeinen Abschnitt weiter
Ton = Schwingung Jeder Ton ist eine Schwingung. Diese Schwingungen werden durch die Luft als Schallwellen übertragen, treffen im Ohr auf das Trommelfell und versetzen es ebenfalls in Schwingungen. Diese werden dann im Ohr weitergeleitet und entsprechend im Gehirn verarbeitet.

Tonhöhe

Je schneller eine Schwingung ist, desto höher ist der Ton. Im Beispiel nimmt die Tonhöhe von links nach rechts zu.
Lautstärke Je stärker die Schwingung ist (höhere Auslenkung), desto lauter ist der Ton. Im Beispiel wird der Ton leiser.
Töne digital speichern

Um Töne zu speichern, muss der in analoger Form vorliegende Ton zunächst in digitale Zahlen umgewandelt werden. Ein Analog-Digital-Wandler (A/D-Wandler) tastet die Auslenkung der Schallwelle in festen Abständen ab und übergibt diese Daten als Zahl an den Computer weiter.
Das Ergebnis ist eine Folge von Zahlen, die auf der Festplatte oder einer Audio-CD gespeichert wird.

Die analoge Welle...
...wird quantisiert und...
...digital gespeichert.
Töne abspielen Um die gespeicherten Informationen wieder in einen Ton umzuwandeln, benötigt man einen Digital-Analog-Wandler (D/A-Wandler). Dieser erzeugt aus den digitalen Daten ein analoges Signal, welches dann verstärkt und von den Lautsprechern in einen hörbaren Ton verwandelt wird.
Abtastrate

Je öfter die Schwingung abgetastet wird, desto genauer (und qualitativ besser) ist das Ergebnis.
Ein hoher Ton wird nur dann genau abgetastet, wenn auch die Abtastrate entsprechend hoch ist. Eine Regel besagt, dass die Abtastrate mindestens doppelt so hoch sein muss, wie die höchste Frequenz, die noch gespeichert werden soll. (Theorem von Nyquist.

Das menschliche Gehör erkennt Töne bis zu einer max. Frequenz von 20kHz (20.000 Schwingungen pro Sekunde). Für eine optimale Klangqualität sind also Abtastraten von mehr als 40kHz nötig.

Aliasing Aliasing-Fehler entstehen, wenn die Abtastrate zu niedrig für die hohen Frequenzen ist. Es bilden sich neue Frequenzen, die vorher nicht im Ton enthalten waren. Abhilfe schafft ein Anti-Aliasing-Filter, der keine Frequenzen durchläßt, die oberhalb der halben Abtastrate liegen.
Auflösung

Jeder einzelne digitalisierte Ausschnitt aus einer Schallwelle (Sample) braucht Speicherplatz im Computer. Je mehr Speicher pro Information reserviert wird, desto feinere Unterschiede kann man speichern.

Standard ist 16 Bit, ein Sample kann also Werte zwischen -32.767 und +32.767 haben.

Mono-Stereo Monoklänge bestehen aus einem Kanal, Stereoklänge benötigen zwei Kanäle und benötigen daher auch doppelt so viel Speicherplatz.
Sample-Raten
8 kHz
8 Bit
mono
Telefonqualität
11 kHz
  8 Bit
mono
Radioqualität
22 kHz
16 Bit
stereo
Kassettenqualität
44 kHz
16 Bit
stereo
Audio-CD
48 kHz
16 Bit
stereo
DAT
96 kHz
24 Bit
stereo
Audio-DVD
Dateiformate

Um Töne in Dateien zu speichern, gibt es verschiedene Dateiformate; die wichtigsten sind:

WAVE
Das Wave-Format wurde von Microsoft und IBM entwickelt und ist seit Windows 3.1 Standard auf PCs. Es unterstützt alle Sample-Raten und Kompressionen.
Die Dateiendung lautet .wav
AIFF
Das Audio Interchange File Format wurde von Apple entwickelt und ist Standard auf allen Macs und den meistem professionellen Audio-Systemen. AIFF unterstützt alle Sample-Raten und in einer Erweiterung AIFF-C auch Kompression.
Die Dateiendung lautet .aif
Speicherbedarf Eine Minute Musik in CD-Qualität benötigt rund 10 Megabyte Speicherplatz.
[44.000 Samples pro Sekunde * 60 Sekunden * 2 Byte pro Sample *2 (stereo) = 10.560.000 Byte = 10,1 Megabyte (bei 1 Kilobyte = 1024 Byte]
kleine Dateien für Web-Sound

Die einfachste Art, eine Datei zu verkleinern, besteht darin, eine der Sample-Eigenschaften zu halbieren: mono statt stereo, 22 kHz statt 44 kHz oder 8 Bit statt 16 Bit. Hier läßt sich - bei teilweise jedoch erheblichen Qualitätsverlusten - eine Menge Platz und Übertragungszeit sparen.

Nach dieser radikalen Vorbehandlung sollte die Datei dann noch komprimiert werden (MP3).

Kompression Es gibt verschiedene Möglichkeiten, die Größe einer Audiodatei zu verringern:
PCM Bei der Puls-Code-Modulation (PCM) wird nicht jedes Sample, sondern nur der Unterschied zum vorherigen Sample gespeichert. So lassen sich 16-Bit-Sounds praktisch ohne Qualitätseinbußen auf 4 Bit komprimieren.

zum Seitenanfang
Was steckt hinter MP3
einen Abschnitt zurückeinen Abschnitt weiter
MPEG Audio
Layer 3
Die korrekte Bezeichnung des MP3-Codecs für Audio-Dateien lautet MPEG Audio Layer 3 und wurde vom deutschen Fraunhofer Institut entwickelt. Bei der Entwicklung standen zwei Ziele im Vordergrund:
Die komprimierte Datei sollte möglichst klein sein und das Dekomprimieren sollte so wenig Rechenleistung wie möglich beanspruchen.
Kompression

Bei der Kompression ins MP3-Format werden nur diejenigen Frequenzen gespeichert, die das Ohr auch wirklich hören kann; alles andere wird gelöscht:

  • alle Frequenzen über und unter dem hörbaren Bereich (20 - 20.000 Hertz)
  • alle verdeckten Frequenzen, d.h. da bei zwei nah beeinander liegenden Frequenzen nur die lautere wahrgenommen wird, wird nur sie mitgespeichert.

Zum Schluss werden die übrig gebliebenen Daten verlustfrei komprimiert (wie bei einer ZIP-Datei).

Bitrate Die wichtigste Option beim Konvertieren in das MP3-Format ist die verwendete Bitrate. Am häufigsten verwendet man 128 KiloBit pro Sekunde. Für jede Sekunde der Datei sind dann 128 KiloBit Speicherplatz vorgesehen. Stehen nach den obigen Kompressionsschritten noch mehr als 128 KiloBit Daten an, wird mit Verlust weiter komprimiert, bis die gewählte Bitrate erreicht ist. Stehen weniger Daten an, werden die nicht benötigten Bits 'aufgehoben' und können an anderer Stelle zugefügt werden.

Stereo

Stereo-Dateien lassen sich stärker komprimieren, da sich rechter und linker Kanal nur wenig unterscheiden. Hierbei wird in einem Kanal die Summe beider Kanäle gespeichert und im anderen Kanal die Differenz der beiden Kanäle. Der Differenzkanal lässt sich deutlich stärker komprimieren, weil er wesentlich weniger Daten enthält.
MP3 im Internet

Eigene Sounds auf der Homepage sollten möglichst klein sein, ohne qualitativ schlecht zu werden.
Die Bitrate sollte 16 - 24 kBit/s möglichst nicht überschreiten.

Damit Sounds bei dieser Komprimierung noch gut klingen, musst du im Vorfeld einiges beachten:

  • Je weniger Höhen ein Sample hat, desto besser läßt er sich komprimieren.
  • Starke Dynamik sollte vermieden werden (kein zu großer Unterschied zwischen lautestem und leisestem Ton)
  • Schränke den Frequenzbereich ein (entferne z.B. aus einem basslastigen Sample die Höhen und umgekehrt).
Codecs

Bei der ursprünglichen Definition von MPEG Audio Layer 3 wurden das Format und der Abspielvorgang standardisiert. Das Encodieren (Komprimieren) ist jedoch nicht standardisiert. Man kann also mit jedem Decoder jede MP3-Datei abspielen, mit verschiedenen Encodern aufgenommene Dateien können bei gleicher Bitrate jedoch gravierende Qualitätsunterschiede haben.

(CoDec = Coder/Decoder, Software oder Hardware zum Codieren und/oder Decodieren von Daten)


zum Seitenanfang
4
einen Abschnitt zurückeinen Abschnitt weiter
   
   
 

 


zum Seitenanfang
5
einen Abschnitt zurückeinen Abschnitt weiter
   
   
   

zum Seitenanfang
Verwandte Themen
einen Abschnitt zurück
 


 
  letzte Aktualisierung:  17.01.2006 12:38


zusammengestellt von Peter Lepke ;    lepke@nils.nibis.de