Musik braucht kaum Speicherplatz auf der Festplatte oder dem Handy? Das haben wir den Entwicklern des Mp3-Codecs zu verdanken. Denn mit dieser Erfindung ist es möglich, Musik so klein zu bekommen, wie wir es gewohnt sind. So belegt der Planetcat Song Werewolf Club auf meiner Festplatte zum Beispiel 87,4 MB. Nach der Umwandlung zu Mp3 belegt er nur noch 6,36 MB. Das ist eine Einsparung von 93%.

Um eine solche Rate bei der Kompression zu erreichen, und die Datei so klein zu bekommen, muss Information verworfen werden, die in der Originalaufnahme vorhanden war. Wie das möglich ist, und warum der Song trotzdem gut klingt, erkläre ich euch in diesem Artikel. Dabei wird nicht nur clever Technik genutzt, sondern es geht auch um uns, unsere Psyche und unser Gehör.

Musik im Speicher

Um Musik auf dem Computer speichern zu können, muss diese in digitalisierter Form vorliegen. Daraus lässt sich die Wellenform der Musik, und damit das Signal für die Lautsprecher vollständig rekonstruieren. Hier wird bereits eine Eigenschaft unserer Ohren verwendet, nämlich die, dass wir nur bis zu einer bestimmten Grenze hören können, und wir ganz hohe Töne nicht mehr wahrnehmen. Nur so funktioniert es, das analoge Musiksignal in Bits und Bytes abzuspeichern.

Diese Dateien sind sehr groß, denn sie enthalten alle Information, die im Bereich von 0 bis 20000 Hz in der Musik passieren. So müssen für jede Sekunde, die das Stück läuft, 44100 Werte gespeichert werden, die wiederum, je nach Auflösung 16, 24 oder 32 Bit Speicher benötigen. Dabei kommt eine ganze Menge zusammen.

Das Ziel ist nun, von diesen Daten eine Menge loszuwerden. Um das zu erreichen haben die Mp3-Entwickler noch ein paar andere Eigenschaften unseres Gehörs und unserer Wahrnehmung ausgenutzt.

Das psychoakkustische Modell

Darstellung der Ruhehörschwelle des menschlichen Gehörs.

Der Aufbau und die Hörweise des menschlichen Gehörs. Alle Töne, die leiser als die (Ruhe)hörschwelle sind, können wir nicht hören. Quelle: Wikimedia

Um herauszufinden, was wir hören, und was nicht, haben die Mp3-Entwickler das menschliche Gehör vermessen. Das funktioniert durch Hörversuche. Dazu wurden Testpersonen Hörbeispiele vorgespielt, und die sagten dann, wann sie etwas sicher nicht mehr hören. So wurde eine "Karte des Gehörs" geschaffen. Da gibt es etwa die Ruhehörschwelle. Alles, was leiser ist als diese Werte, kann ein Mensch von Natur aus nicht wahrnehmen. Wenn nun ein lauter Ton gespielt wird, verändert sich die Ruhehörschwelle zur Mithörschwelle, und im Bereich des Tons können viele andere Töne nicht mehr gehört werden. Der laute Ton unterdrückt alle anderen Töne, die um ihn herum sind. Dieses Phänomen wird Maskierung genannt. Ähnlich ist es mit hintereinander gespielten gleichen Tönen. Diese werden irgendwann, wenn sie ganz knapp aneinander liegen nicht mehr getrennt erfasst, sondern als zusammenhängender Ton wahrgenommen. Dabei spricht man von zeitlicher Maskierung. Teilweise lassen sich diese Effekte mit der Physik im Ohr erklären, teilweise auch mit der Wahrnehmungsfunktion im Gehirn. Wenn es nun gelingt, diese Töne, die Menschen von Natur aus nicht mitbekommen, zu filtern, und alles andere da zu lassen, hat man eine gut funktionierende Kompression.

Die Veränderung der Hörschwelle zur Mithörschwelle rund um einen lauten Ton.

Bei einem lauten Ton lassen sich um diesen herum alle weiteren Töne nicht mehr wahrnehmen, es macht beim Hören keinen Unterschied, ob diese da sind oder nicht. Quelle: Wikimedia

Weglassen mit Stil und Verstand

Normale Mp3-Datei

Nur das, was im Mp3 nicht mehr gespeichert wird.

Jetzt kommt es auf die Frequenzen an. Hohe Töne maskieren andere hohe Töne, tiefe maskieren andere tiefe. Das muss beim Erstellen einer Mp3-Datei erfasst werden. Dazu wird das psychoakkustische Modell auf das Musikstück angewendet, und alles entfernt, was laut dem Modell nicht zu hören ist. Bei Tönen, die knapp über der Mithörschwelle liegen, reicht es den Unterschied zwischen Schwelle und Ton zu speichern, was noch einmal einiges spart. Am Ende hat man ein Musikstück voller Lücken, die aber alle genau da liegen, wo wir sie nicht wahrnehmen können.

Wie gut das funktioniert, merkt man, wenn man beides im Vergleich hört. Dazu haben wir euch ein Beispiel besorgt. Da der Browser normalerweise nur bereits komprimierte Musik abspielt, müsst ihr es euch leider herunterladen und es euch auf eurem PC oder Handy anhören. Erkennt ihr einen Unterschied? Schreibt es unten in die Kommentare! Was alles weggelassen wurde, hört man am besten, wenn man den Unterschied zwischen beiden berechnet und abspielt. Es fehlt tatsächlich eine ganze Menge, die man ohne das, was im Mp3 abgespeichert wurde, auch hören kann. Auch hier gibt es wieder die volle Variante zum Download, denn beim komprimieren des Unterschieds fällt natürlich wieder das psychoakkustische weg.

Download

An dieser Stelle vielen Dank an das Frauenhofer IIS für die Bereitstellung der Hörbeispiele, die gut zeigen, was bei Mp3 passiert.

Welcher Unterschied?

Dadurch, dass das psychoakkustische Modell so gut konstruiert wurde, ist es tatsächlich für Menschen kaum möglich, einen Unterschied zwischen MP3 und der unkomprimierten Version, wie sie auf CDs oder als .wav zu finden ist wahrzunehmen, und meistens ist ein gehörter Unterschied nur psychisch, und kommt daher, das wir meinen, ihn zu hören. Doch der Unterschied kann schnell zum Vorschein kommen, wenn man Mp3-Dateien bearbeitet. Denn wenn man etwa mit einem Filter den Maskierungston erwischt, oder gefilterte Frequenzen anheben möchte, stößt man auf diese Lücken. Deswegen benutzen Musikproduzenten keine MP3-Dateien in der Musikbearbeitung, sondern möglichst nur unkomprimiertes Material. Wenn man ein Musikstück auf einer schlechten Anlage im Vergleich hört, kann ebenfalls ein Unterschied auftreten, weil eine schlechte Wiedergabe von der Bauweise einige Frequenzen filtert, und damit die Lücken aufdeckt.

Mp3, CD oder analog?

Auf guten Anlagen klingt Mp3 genauso gut wie eine CD, auf schlechten rentiert sich die bessere Qualität nicht wirklich und analog hat klanglichen Charme, aber auch Nebengeräusche und Kopierfehler. Daher ist Mp3 für alle eine gute Wahl, die gerne viel Musik speichern oder streamen, denn einen praktischen Unterschied zu CD gibt es nicht. Nur wer Audiobearbeitung macht sollte sich mit verlustfreier Musik abgeben. So spart man dank der Erfindung der MP3-Kodierung eine Menge Speicherplatz und kann noch mehr Musik geniesen.

Ergänzung: Die Hörversuche für Mp3 wurden auf Konuslautsprechern vorgenommen, die an den meisten Stellen verbaut werden. Diese Lautsprecher haben aber akkustische Nachteile, die ebenfalls dazu führen, dass Töne nicht hörbar sind. Es gibt aber auch andere Lautsprecherprinzipe. So soll der Unterschied zwischen Mp3 und CD (WAV) auf sogenannten Biegewellenlautsprechern selbst für einen Laien wahrnehmbar sein, da hier die Fehler nicht vorhanden sind. Wer also auf solchen Lautsprechern hört, sollte dabei bewusst auf Mp3 verzichten.

Quellen:
Hußmann, Prof. Dr. Heinrich, VL Digitale Medien 2016/17
Frauenhofer Institut, SCAI: Mp3. Ein Beispiel für angewandte Mathematik im Alltag. 2012
Zimmermann, Dr. Christian, VL Human-Factors Engineering 2017/18
und eigene Erfahrungen.

Seite kommentieren

Name:

Kommentar:*

Welches Instrument hörst du?*

(Hinweis)

Alle Felder mit * sind Pflicht. Ihre eingegebenen Daten werden mit dem Kommentar veröffentlicht. Mehr dazu in der Datenschutzerklärung..

Bevor Ihr Kommentar zu sehen ist, wird erst geprüft, ob er angemessenen Umgangsformen entspricht. Bitte haben Sie etwas Gedult, bis er hier erscheint.