Er ist schuld

brandenburg_kino.jpg

Nichts hat die Musik-Industrie so sehr verändert wie die Erfindung des MP3-Formats. Karlheinz Brandenburg war damals einer der Chef-Entwickler am Fraunhofer-Institut. Im Interview lässt er die Erfolgsgeschichte Revue passieren, erklärt, warum ihm Kastagnetten fast den Verstand geraubt hätten, und wundert sich, dass die Musikindustrie erst jetzt langsam die Chancen des MP3 begreift.

von Hendrik Lakeberg aus De:Bug 111

In blassgelbem Hemd, roter Krawatte und grauem Jackett sitzt Karlheinz Brandenburg in der Hotellobby des Innside Premium Hotel. Mit seinem etwas fusseligen Bart und der leicht ausgedünnten Stirn sieht er aus wie der liebenswerte Prototyp eines deutschen Ingenieurs. Seine Gesten wirken besonnen und pointiert. Wenn Karheinz Brandenburg redet, legt er kontrolliert und etwas steif die Fingerkuppen aufeinander.
In den Neunziger Jahren wurden Brandenburg und sein Team am Fraunhofer Institut zu Revolutionären. Mit ihrer Erfindung der MP3 stürzten sie die Musikindustrie ungewollt in die tiefste Sinnkrise ihrer Geschichte und trugen dazu bei, dass sich die Vertriebskanäle für Musik quasi über Nacht fast komplett ins Internet verschoben. Illegal zunächst. Klagewellen gegen Nutzer von Filesharingsystemen wie Napster und eine hitzig geführte Urheberrechtsdebatte folgten. Und auch knapp zehn Jahre später scheint rund um das kompakte Kürzel MP3 immer noch keine Ruhe eingekehrt zu sein. Unlängst reklamierte der Alcatel/Lucent-Konzern ein Patentrecht an dem MP3-Verfahren, verklagte Microsoft wegen Patentrechtsverletzungen und bekam in der ersten Instanz eine Summe von 1,53 Milliarden Dollar zugesprochen. Auch Karlheinz Brandenburg war an diesem Prozess als Zeuge beteiligt. Das MP3 wurde in den letzten Jahren zum alles beherrschenden Speichermedium für Musik. Und Karlheinz Brandenburg leitet mittlerweile in Ilmenau, mitten in der Thüringer Provinz, ein neu gegründetes Fraunhofer Institut mit dem Schwerpunkt Digitale Medientechnologie. Neben der Forschung verbringt der 51-Jährige den Großteil seiner Arbeitszeit mit Repräsentanz- und Beratungstätigkeiten.

“Die Hauptsache ist, dass der Musikgenuss bleibt. Darum geht es im Endeffekt”, wird Karlheinz Brandenburg im Interview sagen. Doch was versteht man unter “Musikgenuss”? An keinem Punkt in der Musikgeschichte zirkulierte mehr Musik durch die unzähligen legalen und illegalen Vertriebskanäle des Internets. Doch hat man plärrende Handylautsprecher oder schlecht encodierte Myspace-MP3s im Ohr, dann wird man den Eindruck nicht los, dass Musik selten schlechter klang als heute. “Ein Irrtum”, würde Karlheinz Brandenburg sagen.

Wieso haben sie sich entschieden, Audio zu komprimieren? Sie hätten sich auch mit anderen digitalen Formaten beschäftigen können?

Das war einfach Glück. Mein Doktorvater Professor Seitzer hatte schon in den 70ern die Idee, Musik so weit zu komprimieren, dass man sie über ISDN übertragen kann. Er hat damals mit einem Kollegen ein Patent angemeldet, das sich genau darauf bezog: die Verschickung von Musik über ISDN. Der Patentprüfer hatte daraufhin gesagt, dass das nach dem Stand der Technik gar nicht funktionieren kann. Dann hat Professor Seitzer einen Doktoranden gesucht, der zeigen sollte, dass es eben doch geht. Ich war zufällig gerade mit meiner Diplomarbeit fertig. Er hat mir das Thema angeboten. Glück gehabt. Es ist ja meistens nicht so, dass es darum geht, besonders gut zu sein. Das ist sowieso die Voraussetzung. Aber man muss darüber hinaus mit den richtigen Ideen am richtigen Ort sein, zur richtigen Zeit die richtigen Leuten treffen.

Gab es einen Moment, an dem Sie realisiert haben, was für eine bahnbrechende Erfindung Ihnen und Ihren Kollegen da gelungen ist?

Das erste Mal 1997. Als die Dinge begannen, durch die Presse zu laufen. Angefangen mit USA Today, die über die Sperrung von irgendwelchen illegalen Servern an amerikanischen Universitäten berichteten. Und dann 1998, als der erste verkaufte Musikspieler auf Flashbasis tatsächlich unser Verfahren MP3 integrierte. Diesen Mpman in der Hand zu haben und vor allem die Reaktion der Leute zu spüren, die sagen, was für eine tolle Sache das ist. Und fragten, was das Gerät denn kostet …
Da haben wir schon gedacht, jetzt rollt die Lawine und es kann uns nichts mehr aufhalten. Ich weiß, dass wir um dieselbe Zeit auf einem Messestand den Claim geschrieben haben: Layer 3, das weit verbreitetste Verfahren der Musikkomprimierung. Damals haben Leute von Dolby noch säuerlich darauf reagiert und misstrauisch gefragt, ob das denn stimmen würde. (lacht) Nichts gegen Dolby, wir sind gute Freunde mit denen.

Und diese unglaublich weit reichenden Konsequenzen, die die Erfindung MP3 gehabt hat? Inwiefern beschäftigt Sie das? Neben der Urheberrechtsdebatte, die das Format befeuert hat, änderte sich ja auch die Wahrnehmung und der Gebrauch von Musik entscheidend …

In Anbetracht der Urheberrechtsproblematik, für die wir 1994, 1995 schon ein sehr waches Auge hatten, ist es eine Befriedigung, zu merken, dass die Musikindustrie jetzt so langsam Dinge einsieht, die wir ihnen schon seit langem predigen. Ich meine damit vor allem die Nutzerfreundlichkeit und die technischen Standards, die es braucht, um wirklich zu den Kunden zu kommen. Kopierschutz sollte es nur so geben, dass er für die Leute praktisch nicht bemerkbar ist. Alle, die brav legal für die Musik bezahlt haben, sollten dafür nicht auch noch bestraft werden, sondern einfach nur ihre Musik genießen können. Aber für die, die nicht zahlen, sollte schon ein Stolperstein da sein. Wir bei Fraunhofer waren nie der Meinung, dass – ohne das Einverständnis der Leute, die die Rechte haben – alle Musik frei und für immer zur Verfügung stehen sollte. Geistiges Eigentum muss auch in Zukunft etwas wert sein. Im Nachhinein ist es interessant, welche Entwicklung damals im Ansatz schon sichtbar war. Es gab zum Beispiel Ende 1994 einen englischen Kleinunternehmer, der einen Musikvertrieb über das Internet machen wollte. Er meinte zu uns: “Do you know that you will destroy the music industrie?” Dann sind wiederum Situationen aufgetaucht, die wir gar nicht im Blick hatten. Musik auf portablen Abspielgeräten … das haben wir als Perspektive gesehen. Dass man heute aber Musik für Wochen oder gar Monate mit sich herumtragen kann, das konnten wir uns damals nicht vorstellen. In den späten 80ern wurde ich gefragt, was man denn mit dem Kompressionsformat machen könnte? Ich habe daraufhin gesagt, man könnte eine CD herstellen, auf der zwölf Stunden Musik drauf wäre, die aber tatsächlich auf das Zwölffache kosten müsse. Wer würde die denn kaufen? Das Selber-Brennen war noch kein Thema.

Zur Funktionsweise der MP3: Das Prinzip basiert auf den Gesetzen der Psychoakustik. Was war damals das Neue an MP3 in Bezug auf Klangspeicherung und Klangwiedergabe.

Zunächst ist MP3 Teil des in den 80ern entwickelten Video- und Audiokompressionsstandards MPEG. MP3 steht für MPEG Audio Layer 3.
MP3 macht eigentlich nichts anderes als viele andere Audiokompressionsformate. Dolby Digital und Windows Media Audio funktioniert ähnlich. Das war damals nicht das Wesentliche. Der große Erfolg von MP3 war, dass es zu einem bestimmten Zeitpunkt, an dem eine solche Technik gebraucht wurde, das am besten funktionierende System war.
Was MP3 macht, versuchen viele andere Formate auch in ähnlicher Weise. Aber wie funktioniert es: Es nimmt in kleinen Blöcken, von zum Beispiel 24 Millisekunden, Musikdaten, analysiert das Frequenzgemisch und versucht abzuschätzen, wie das menschliche Ohr damit umgehen könnte. Es stellt fest, welche Frequenzkomponenten weggelassen werden könnten, weil sie nicht hörbar sind oder von anderen Frequenzen verdeckt werden. Dann stellt es fest, wie genau ich überhaupt übertragen muss, so dass der Unterschied zum Originalformat nicht mehr hörbar ist. Das geschieht mit einer ganzen Menge Rechenoperationen. Daraus wird der so genannte Bistrom produziert, in dem eine Beschreibung steckt für die Anteile des Tons, des Musiksignals bei den verschiedenen Frequenzen. Das wird im Decoder dann zusammengesetzt zu einem Musiksignal, was sich subjektiv nicht unterscheiden soll zu dem, was am Anfang war.

Gibt es da wirklich keinen hörbaren Unterschied zum Original?

1991 haben wir mit einer Vorgängerversion ein Experiment gemacht, einen HighEnd-Kassettenrekorder von Nakamichi genommen. Ein Gerät, das damals um die 2000 Mark gekostet hat und in der Fachpresse in den höchsten Tönen gelobt wurde. Wir haben dieselbe Art Testsignal, die wir verwendet haben, um das MP3 zu testen, auf Kassette aufgenommen und in dem Kassettendeck abgespielt. Es handelte sich um ein Glockenspiel. Das sind Audiosignale, die für MP3 relativ kritisch waren. Das Kassettengerät hat das Signal zerstört. Was beim MP3 an Unterschieden bleibt, ist eigentlich geringer, als dass, was wir aus der HiFi-Technik gewohnt sind. Jeder Lautsprecher in Verbindung mit dem Klang eines Raumes ändert das Signal, die Klangfarbe, also wie wir die Musik wahrnehmen, entscheidender, als die Kompression durch ein gut encodiertes MP3. Lautsprecher wirken immer mit der Akustik zusammen. Die klanglichen Unterschiede sind uns nur oft nicht bewusst, weil unser Gehirn sie ganz automatisch wieder korrigiert. Aber das Format MP3 hat sicherlich auch Grenzen. Bei bestimmter Musik produziert es Artefakte, die für unsere Ohren nicht schön sind. Erst mit der Entwicklung des AAC-Formats (Advanced Audio Coding), das mittlerweile bei ITunes im Einsatz ist, haben wir das überwunden. Das sind ganz klar Geburtsfehler des MP3. Aber selbst dafür brauche ich eigentlich ein trainiertes Ohr, um sie richtig wahrzunehmen.

Was sind diese kritschen Punkte?

Trocken perkussives Material. Das hängt zusammen mit der Frequenzanalyse. Wenn Sie zum Beispiel ganz trockene Kastagnetten-Anschläge nehmen, dann hört man ein Störgeräusch auf den Anschlägen. Das ist dann für das kritische Ohr hörbar. Oder auch mit einem einzelnen Triangel-Anschlag hat das Format Probleme. Wobei dieses Störgeräusch nur ein paar Millisekunden lang ist. Wenn man gelernt hat, darauf zu hören, bemerkt man es. Es gibt andere Signale, die empfindlich sind bei MP3s mit zu geringer Bitrate. Zum Beispiel ein forschungsintern bekanntes Testsignal einer Stimmpfeife. Oder eine bestimmte Aufnahme eines Cembalos. Wenn sie in der MP3-Qualität zu weit heruntergehen, dann hört sich das ganz gräußlich verzerrt an. Zum Zehennägelhochrollen. Da ist aber die einfache Lösung, eine höhere Bitrate und weniger Kompression zu verwenden. Man hat ja immer die Wahl. Das Problem mit den Kastagnetten kriegen sie bei MP3 nie ganz in den Griff. Aber wie gesagt, das sind Unterschiede, die deutlich geringer sind, als sie das hochwertige Kassettendeck vor 15 Jahren hatte.

Es gibt Leute, die immer noch ganz große Stücke auf Vinyl halten und auf die analoge Klangwiedergabe …

Das ist reine Psychologie. Aber dem ist natürlich Vorschub geleistet worden. In der Anfangszeit sind bei CD-Aufnahmen und CD-Abspielgeräten technische Fehler gemacht worden, die zu unangenehmen Störungen geführt haben, die es auf einer sauber produzierten LP nicht gibt. Aber diese Probleme sind längst überwunden. Meine Vermutung ist, dass die Leute, die den Klang der Schallplatte bevorzugen, eigentlich die typischen Störgeräusche einer Langspielplatte als angenehm empfinden. Der CD ist außerdem vorgeworfen worden, dass sie zu kalt klingen würde. Einerseits ist es so, dass, immer wenn die Möglichkeiten der Klangspeicherung besser werden, auch die Aufnahmen selber nachziehen müssen. Vielleicht sind auch da Fehler gemacht worden. Andererseits haben wir seinerzeit, um die minimalen Unterschiede herauszuhören, viele Musikstücke immer und immer wieder angehört. Kritisch angehört, unter optimalen Abhörbedingungen, in einem akustisch bestens kontrollierten Raum, mit teuren Monitorlautsprechern oder der Oberklasse von elektrostaten Kopfhörern. Dabei haben wir in der Originalaufnahme von fast jedem Stück irgendetwas gefunden, von dem wir gedacht haben, das es eigentlich nicht dahin gehörte. Das ist wie beim Foto, wo man einen Kratzer oder Staub vom Objektiv entdeckt. Aber wenn all diese Dinge draußen wären, würden Aufnahmen tatsächlich steril klingen. Dann fehlt die Atmosphäre. Insofern gehören kleine Fehler wohl zur Atmosphäre dazu.

Nach MP3 kamen zahlreiche andere Formate. Wie zum Beispiel Ogg, Apple Lossless, Flac. Was haben diese Formate anders gemacht?

Man kann da verschiedene Dinge sehen: Das sind natürlich erst mal Konkurrenzformate, die dasselbe tun mit mehr oder weniger Erfolg. Als Vertreter einer ganzen Kategorie – es gibt mittlerweile andere, die ähnlich Gutes können – würde ich das AAC (Advanced Audio Coding)-Format und die daraus entstandenen Formate nennen. An AAC haben wir selber intensiv mitgearbeitet. Es komprimiert besser bei gleichbleibender Qualität. Ein Ableger davon ist High Efficiency AAC (HE-AAC), das besonders effizient komprimiert und heute zum Beispiel auf Handys verwendet wird. Wir haben bei diesen Formaten nach ein paar Jahren überprüft, was wir mit MP3 gemacht haben, und das überarbeitet. Bei neueren Formaten ist es immer so, dass man mehr Komplexität einsetzen kann, was die Rechenleistung der Computer angeht. MP3 hatte am Anfang den Ruf, für praktische Anwendungen ungeeignet zu sein, weil es viel zu kompliziert ist. Das relativiert sich nach ein paar Jahren. Bei AAC hatten wir einfach mehr Möglichkeiten zur Verfügung, was Rechenpower und Speicherkapazität angeht.

Warum galt MP3 als zu kompliziert?

Das bezog sich auf die Rechenprozesse und die Speicherleistung, die gegeben sein müssen, um sie abspielen zu können. In den frühen 90ern war das ein ganz schwerwiegendes Argument. Man darf nicht vergessen: Erst 1994/95 sind die Standard-PCs schnell genug geworden, um MP3 mit Hilfe einer normalen Soundkarte ohne Zuhilfenahme von Spezial-Hardware abspielen zu können. Vorher hat man das Äquivalent von HighEnd-Grafikkarten gebraucht. Man hätte sich damals eine MP3-Abspielkarte kaufen müssen. Bei AAC haben wir also weniger Kompromisse machen müssen. Das hat zu einem Verfahren geführt, dass einerseits besser komprimiert, aber andererseits eine bessere Tonqualität ermöglicht.

Zu AAC gehört zum Beispiel auch MP4?

AAC ist Teil des MPEG-4-Standards in einer bestimmten Variante. Schaut man ein MP4-Video, hört man in der Regel AAC-Sound. Die Stärke von AAC, stärker komprimieren zu können bei möglichst gleichbleibender Qualität, kann man vor allem in neuen Segmenten wie Handy-Downloads ausspielen. Übrigens hat auch Microsoft Media Audio an einem ähnlichen Format gearbeitet, ihnen ist das aber nicht gelungen. Auf der anderen Seite gibt es die Leute, die sagen: psychoakustische Verfahren schön und gut, aber das Beste wäre es doch wirklich, exakt dieselben Bits des Originals wieder rauszubekommen. Das nennt man dann Lossless-Verfahren, also Formate wie Apple Lossless oder Flac. Da gibt es das Problem, dass die Komprimierung nicht so weit geht wie zum Beispiel MP3 oder AAC. Es gab vor ein paar Jahren mal Leute, die gesagt haben, sie hätten das geschafft. Aber wer das behauptet, hätte eigentlich das Perpetuum Mobile erfunden. Man kann mathematisch relativ einfach zeigen, dass das nicht möglich ist. Man landet immer nur bei einer relativ geringen Kompressionsrate. Statt 8:1 oder gar 12:1, bei MP3 eine gängige Komprimierungsrate, kommt man nur auf 2:1. Dafür hat man aber wirklich dieselben Bits wieder. Der Vorteil des Lossless-Verfahrens ist es, dass man bei einer Umwandlung in andere Formate keinen Qualitätsverlust hat. Bei der Umwandlung von zum Beispiel Windows Media Audio in MP3 hätte man das.

Vor zwei Jahren haben Sie vor einem Krieg der verschiedenen Formate gewarnt. Wie sehen Sie die Situation heute?

Die Situation ist schon relativ übersichtlich. Wenn ich mich richtig erinnere, ging es damals eher um Digital Rights Management als um die Codecs selber. Was ich gemeint habe, ist, dass Interoperabilität ganz wichtig ist. Gerade um zu vermeiden, dass man von einem ins andere Format umcodieren muss. Wenn ich meine Musik von iTunes hole, decodiere, auf CD brenne, die CD wieder rippe und das Gerippte in einen MP3-Spieler übertrage, der dann wieder nur Windows Media Audio kann, ist das keine gute Idee. Das kann man umgehen, wenn man nur ein Format hätte, das von allen Diensten vertrieben wird und auf alle Player geht. Einen DRM- Mechanismus zu ändern, führt zu keinen klanglichen Verlusten. Aber mittlerweile ist es so, dass es nur zwei Formate gibt, die von allen gekonnt werden. Das eine komprimiert gar nicht, also Wav. Und bei den komprimierenden ist es MP3. Dann gibt es ein Verfahren, das in verkauften Geräten und legal runtergeladener Musik 80% Marktanteil besitzt und von einer Firma kommt. Das ist AAC mit Apples DRM. Dann gibt es Windows Media Audio, dass von weiteren etwa hundert Herstellern unterstützt wird und zusammen auf etwa 20% Marktanteil kommt.

Was sagen Sie zu dem Vorstoß von Steve Jobs, die Musik in iTunes Rightsmanagement-frei zu verkaufen?

Steve Jobs ist ja nicht der Erste, der diese Diskussion aufgegriffen hat. Aber im Moment spitzt sie sich noch mal deutlich zu. Das Verkaufssystem von EMusic spielt da eine große Rolle. Emusic liegt in den USA hinter iTunes in Bezug auf die Verkaufszahlen auf Platz zwei, obwohl sie von den großen Labels keinen Content haben. Sie verkaufen nur MP3s, die zwar mit einer Watermark versehen sind, aber sonst auf jegliches DRM-System verzichten. Und das zeigt, dass sich da doch ein Geschäft machen lässt. Ich verstehe, dass die Labels große Angst davor haben. Andererseits habe ich gerade von Leuten, die Musikverkaufssysteme vertreiben oder organisieren, oft gehört, dass die glauben, ihren Umsatz erheblich steigern zu können, wenn der Content DRM-frei wäre. Es würde mich überhaupt nicht wundern, wenn in absehbarer Zeit eines der großen Labels einen Versuch in diese Richtung startet. Noch ist aber ganz schwer zu sagen, wer da zuerst vorprescht.

Durch die MP3 ist zwar so viel Musik wie nie zuvor in Umlauf, oft aber in schlechter Qualität. Müssen wir befürchten, dass die Audioqualität grundsätzlich schlechter wird?

Eine Möglichkeit ist, dass durch die größeren Speicherkapazitäten, die uns zur Verfügung stehen, eine Kompression irgendwann nicht mehr notwendig sein wird. Aber ich sehe im Moment die Tendenz, dass viele Leute ihre CDs mit mindestens 192 kbs rippen. In Bezug auf die psychoakustischen Verfahren bestand der letzte große Qualitätssprung in AAC. Seither hat sich da nicht mehr so viel getan. Aber es ist schwer, Vorhersagen zu treffen. Ich erinnere mich, wie ich damals im Anschluss an meine Doktoranden-Zeit 1989 bei AT&T gearbeitet habe und mein neuer Chef die Frage gestellt hat, wie weit es noch gehen wird? Da kann ich nur sagen: Was mittlerweile geht, übersteigt das, was ich mir damals gedacht habe, was gehen könnte, ganz deutlich. Meine Kollegen in Erlangen arbeiten mittlerweile an MP3-Surround und die ganze Familie drumherum. Zum Beispiel mit Ensonido einen Fünfkanalklang über normale Kopfhörer wiedergeben zu können. Oder … ewig versucht und immer noch schwierig … aus Zweikanal-Musik Dolby Surround zu machen. Mp3 SX nennen wir das.

Welchen MP3-Player besitzen sie eigentlich?

Ein schöner 8 GB Nano iPod ist gerade mein Lieblingsstück.

Fraunhofer Institut

2 Responses