Current Page: Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: m04 » Learning Units » Unit ID: 03_16
Last Modified:Tuesday, 2015-05-05 - 08:09:06
 
Tools: ValidatePreview XML Preview HTML Preview PDF
Alternative: Printable HTML

 

Learning Unit ID: 03_16
Title: AC-3
Abstract: AC-3 ist ein von der Firma Dolby unabhängig von MPEG entwickelter Audiodecoder. Seine Stärken liegen in der Kodierung von Mehrkanalstereofonie. Ähnlichkeiten zu Audio MPEG bestehen bei der Filterbank und der prinzipiellen Arbeitsweise des psychoakustischen Modells, unterschiedlich sind hingegen die Technik der Bitzuweisung und die Mehrkanalkodierung.
 
Status: Final for Review #2 - Version: 2004-11-04
History: 2004-11-04 (Thomas Migl): Acro added
2004-10-25 (Thomas Migl): Pda Abb. hinzugefügt
2004-09-21 (thomas migl): Bildbeschriftung für PC korrigiert
2004-09-10 (Thomas Migl): Abb.Blockschaltbild hinzugefügt
2004-08-16 (Robert Fuchs): Checked, fixed and exported for Review #2.
2004-08-06 (Thomas Migl): In Greybox importiert, finalisiert ausser Abb. fehlt
2004-03-12 (Robert Fuchs): Closed for 50% Content Deadline import in Scholion.
2004-03-11 (Thomas Migl): LOD1 Headers added
2004-03-05 (Thomas Migl): Abstract hinzugefügt
2004-03-05 (Robert Fuchs): Put sources into CorPU title where neccessary; added links.
2004-02-27 (HTMLContentTools): Replaced old numeric source refs by new alphanumeric ones.
2004-02-26 (Robert Fuchs) - Upgrade from old LU 460, version 2003-12-03.
2004-02-25 (HTMLContentTools) - Created skeleton page.
2003-12-03 (Robert Fuchs): Import von Version 2003-08-23 aus HTML Authoring Systeme v.1

Author
Author 1: Thomas Migl E-Mail: migl@ims.tuwien.ac.at
Author 2: (empty) E-Mail: (empty)
Author 3: (empty) E-Mail: (empty)
Author 4: (empty) E-Mail: (empty)
Author 5: (empty) E-Mail: (empty)
Organization: Technische Universität Wien; Institut für Softwaretechnik und Interaktive Systeme; Arbeitsgruppe für Interaktive Multimediale Systeme; http://www.ims.tuwien.ac.at/

Content

Einführung todd1994

1

auto

  • AC-3 ist ein perzeptueller Audiocoder
  • AC-3 entwickelt von Firma Dolby, kein MPEG Coder
  • ursprüngliches Ziel war Mulitkanal Tonspur für
    • HDTV
    • Kinofilme
  • Heute auch weite Verbreitung durch Video DVD 311

2

auto

AC steht für Audio Coding und ist ein von der Firma Dolby unabhängig von MPEG entwickelter Audiokoder. Er nutzt zur Datenkomprimierung ebenfalls die perzeptuellen Eigenschaften des menschlichen Gehörs. Ursprüngliche Zielsetzung des Coders war, eine für das Fernsehen, im speziellen für das amerikanische HDTV 307, geeignete Mehrkanaltonspur zu bieten. Die ersten Erfolge hatte AC-3 allerdings im Kino. Mit AC-3 war es zum erstenmal möglich, auf einem 35 mm Filmstreifen zwischen Bild und Filmperforation eine Tonspur zu legen, auf der ein 5.1 Channel (siehe 5.1 bei AAC) Audiosignal gespeichert ist. Die Datenrate ist dabei auf 320 kbps festgelegt. Der erste Film, der AC-3 verwendete, war Star Trek VI im Jahre 1991. Für HDTV 307 arbeitet AC-3 mit 6 Kanälen bei einer Datenrate 384 kbps (entspricht einer Kompression von 13:1). Neben Kinofilmen und HDTV spielt heute AC-3 auch für die Video DVD 311 eine große Rolle. Obwohl für den Videodatenstrom ausschließlich MPEG 31 eingesetzt werden kann, wird für die Tonspur sehr oft AC-3 verwendet.

AC-3 arbeitet neben 5.1 channel (siehe 5.1 bei AAC) in Mono,Stereo und in verschiedene Mehrkanalmodi. Auch die Datenbitraten können frei gewählt und so an die jeweiligen Anwendungen angepasst werden.

Vergleich zu MPEG Audio

1

Ähnlichkeiten von MPEG Audio und AC-3

Unterschiede zwischen MPEG Audio und AC-3

  • keine Bitzuweisungsdaten im Datenstrom (siehe MPEG Datenstrom)
  • Spektrale Hüllkurve statt FFT
  • AC-3 komplexere Mulltikanalkodierungstechnik

2

Ähnlichkeiten von MPEG und Audio AC-3

AC-3 verwendet wie MPEG Audio die Subbandtechnik. Zur Vermeidung des Pre-Echoeffektes kann zwischen einem langen und einem kurzem Fenster (siehe Fenster in MP3) geschalten werden. Ähnlich wie bei MPEG Audio wird das Eingangsignal mit Hilfe einer AC-3 eigenen Filterbank in Frequenzbänder aufgeteilt, deren Werte mit Hilfe eines psychoakustischen Modells auf ihre Maskierungseigenschaften hin untersucht und mit den daraus sich ableitenden notwendigen Wortlängen versehen werden (siehe auch die Lerneinheiten MP3 und AAC).

Unterschiede zwischen MPEG Audio und AC-3

  • Bitzuweisung
    • Bei MPEG Audio werden die Daten zur Bitzuweisung in den MPEG-Datenstrom integriert. Bei AC-3 werden, um an Datenrate zu sparen, keine, beziehungsweise nur minimal, Daten zur Bitzuweisung in den Datenstrom integriert.
  • Spektrale Hüllkurve
    • Bei AC-3 wird zur Gewinnung der vom psychoakustischem Modell benötigten Eingangsdaten keine eigene FFT verwendet, sondern diese werden direkt aus den Werten der Filterbank als "spektrale Hüllkurve" generiert. Die spektrale Hüllkurve wird eigens kodiert und in den Datenstrom integriert
  • Mehrkanalkodierung
    • AC-3 verwendet sehr ausgeklügelte Algorithmen, um Datenredundanzen, auch perzeptuelle, zwischen den verschiedenen Kanälen zu eliminieren

Methoden der Bitzuweisung todd1994 watk2001, 323

1

  • Vorwärts adapitve Bitzuweisung
    • Bitzuweisungsdaten im Datenstrom integriert
      • Vorteil
        • einfacher Decoder
        • hohe Genauigkeit
      • Nachteil
        • zusätzliche Datenrate
        • Untergrenze für Datenrate
  • Rückwärts adaptive Bitzuweisung
    • Bitzuweisungsdaten im Datenstrom nicht integriert
      • Vorteil
        • keine zusätzliche Datenrate
      • Nachteil
        • komplexerer Decoder
        • Anfällig für Rechenfehler
        • psychoakustisches Modell beschränkter Komplexität
        • psychoakustisches Modell nicht upgradebar
  • Hybridbitzuweisung bei AC-3
    • nützt Vorteile der beiden Techniken
    • eliminiert Nachteile der beiden Techniken

2

Prinzipiell gibt es für den Decoder zwei Möglichkeiten, auf die benötigten Bitstellen der Daten rückzuschließen. AC-3 benutzt eine Mixtur der beiden Techniken, in der Absicht die jeweiligen Vorteile zu nutzen und die Nachteile zu elimineren.

Vorwärts adapitve Bitzuweisung

Es werden die Bitzuweisungsdaten im Encoder erzeugt und in den Datenstrom eingebunden (siehe MPEG Audio Kodierungsprinzip). Dies ist die Bitzuweisung, wie sie in MPEG-Audio ausschließlich verwendet wird.

Vor- und Nachteile

  • Vorteil
    • Decoder sind einfach aufgebaut, müssen nur die Daten für die Bitzuweisung aus dem Datenstrom übernehmen
  • Nachteil
  • Es ergibt sich eine zusätzliche Datenrate durch Bitzuweisungsdaten
    • 4kbps/Kanal bei 24 ms Fenster, 12 kbps/Kanal bei 8 ms Fenster bei MPEG/Audio, dadurch ergibt sich eine natürliche Untergrenze für die erzielbare Datenrate

Rückwärts adaptive Bitzuweisung

Hier ergeben sich die Bitstellen für die entsprechenden Daten aus den Daten selbst ohne jegliche Zusatzinformationen von Seiten des Encoders. Dazu muss dem Decoder das im Encoder verwendete Psychoakustische Modell bekannt sein. Anhand dieses Modells bewertet er die Daten und führt das Audiosignal in seine unkomprimierte Form zurück.

Vor-und Nachteile

Vorteile

Es sind keine zusätzlichen Bitzuweisungsdaten notwendig und somit auch keine zusätzliche Datenstromraten. So stehen in einem Datenstrom mit Rückwärts adaptiver Bitzuweisung mehr Bit für die eigentlichen Daten zur Verfügung. Die rückwärts adaptive Bitzuweisung eignet sich daher für Anwendungen, in denen hohe Qualität bei geringen Datenraten verlangt wird.

Nachteil

Im Decoder müssen erst die benötigten Bitstellen aus den im Datenstrom zur Verfügung stehenden Daten errechnet werden, was einen höheren Anspruch an die Decoder stellt. Bei dieser Berechnung entstehen zusätzliche Fehler: Einerseits sind die Daten manchmal zu ungenau, um ein 100 prozentig richtiges Resultat zu erhalten, andererseits können im Decoder, der Echtzeitperformance in Kombination mit einer einfachen Hardware bieten muss, nur Algorithmen beschränkter Komplexität verwendet werden. Ein weiterer Nachteil ist, dass auf Encoder- und auf Decoderseite mit haargenau dem gleichen psychoakustischem Modell gearbeitet werden muss. So kann man unter anderem aus Kompatibilitätsgründen das psychoakustische Modell niemals upgraden.

Hybridbitzuweisung bei AC-3

Für AC-3 wurde eine eigene Hybridbitzuweisung entwickelt, die jeweils die Vorteile der beiden Techniken ausnützt, aber deren Nachteile eliminiert. Die genaue Funktionsweise wird in der Beschreibung des AC-3 Blockschaltbildes erläutert.

AC-3 Blockschaltbild todd1994

1

AC-3 Encoder/Decoder PC

AC-3 Encoder/Decoder PDA_Phone

2

AC-3 Encoder/Decoder PC

AC-3 Encoder/Decoder PDA_Phone

Beschreibung des AC-3 Blockschaltbildes

Rückwärts adaptive Bitzuweisung bei AC-3

Encoder
  • Filterbank
    • Die durch die Filterbank ermittelten Werte werden bei AC-3 in Form Mantisse/Exponent dargestellt. Mantisse und Exponent jedes Wertes werden anschließend getrennt voneinander kodiert.
  • Spektrale Hüllkurve
    • Die Exponenten bilden die Spektrale Hüllkurve. Die spektrale Hüllkurve erfüllt die selbe Funktion wie die FFT bei MPEG Audio, mit dem einzigen Unterschied, dass sie sich direkt aus den Werten der Filterbank ergibt. Zur Integration in den AC-3 Datenstrom wird die spektrale Hüllkurve mit einer speziell entwickelten Technik kodiert (So wird unter anderem nur der unterste Wert des Frequenzspektrum vollständig kodiert, für die darüberliegenden Frequenzkoeffizienten nur die Differenzbeträge, etc).
  • Hauptbitzuweiser
  • Quantisierer
    • der Quantiserer reduziert die Mantissenwerte auf die vom Hauptbitzuweiser errechneten Bitstellen
  • Mulitplexer
    • Im Mulitplexer werden sowohl die quantisierten Mantissenwerte wie auch die komprimierte Spektrale Hüllkurve in den AC-3 Datenstrom integriert.
Decoder
  • Demultiplexer
    • Zur perzeptuellen Bewertung des Eingangssignals extrahiert der Demultiplexer die spektrale Hüllkurve. und die quantisierten Mantissenwerte
  • Decoder der Spektralen Hüllkurve
  • Hauptbitzuweiser
    • Hierbei handelt es sich um die gleiche Programmroutine wie im Encoder. An Hand der spektralen Hüllkurve bewertet er das Signal auf dessen Maskierungsverhalten und liefert natürlich dieselben Ergebnisse wie sein Konterpart im Encoder.
  • Entquantisierer
    • Einerseits bekommt er vom Multiplexer den Datenstrom der Mantissen, anderseits liefert der Hauptbitzuweiser die Wortlänge jedes Mantiisenwertes. So kann der Entquantisierer die einzelnen Matissenwerte aus dem Datenstrom identifizieren und sie auf ihre ursprüngliche Wortlänge rücktranformieren.
  • Filterbank
    • hier wird das Ausgangssignal generiert

Vorwärts adapitve Bitzuweisung bei AC-3

Encoder

Um die Nachteile der Rückwärts adaptiven Bitzuweisung (Rechenfehler und Beschränkung der Komplexität des psychoakustischem Modells) zu vermeiden, verwendet AC-3 parallel die Vorwärts adapitve Bitzuweisung.

  • Bitzuweiser
    • Parallel zum Hauptbitzuweiser läuft im Encoder eine davon unabhängige Bitzuweisung, die ein komplexeres psychoakustische Modell beinhaltet und daher ein entsprechend genaueres Ergebnis liefern kann. Dieses wird fortlaufend mit dem Ergebnis der Programmroutine verglichen, eventuelle Differenzen werden an den Hauptbitzuweiser weitergegeben.
  • Hauptbitzuweiser
    • Der Hauptbitzuweiser korrigiert sein selbsterrechnetes Ergebnis.
  • Mulitplexer
    • Die Bitzuweisungsseiteninformationen werden in den AC-3 Datenstrom integriert.
Decoder
  • Demultiplexer
    • Der Demultiplexer übergibt die im AC-3 Datenstrom enthaltenen Seiteninformationen den Hauptbitzuweiser.
  • Hauptbitzuweiser
    • Der Hauptbitzuweiser korrigiert den Seiteninformationen entsprechend seine selbst errechneten Ergebnisse.

Mehrkanakkodierung bhas1997, 375 todd1994

1

auto

  • AC-3 für Mehrkanalkodierung optimiert

Technik der AC-3 Mehrkanalkodierung

  • Zwei wesentliche Features
    • Global Bit Pool
    • Kopplung hoher Frequenzen

2

auto

AC-3 wurde speziell zur Kodierung von Mehrkanalaudio entwickelt und spielt auf diesen Gebiet auch seine volle Stärke gegenüber anderen Kodierungstechniken aus. Die Effektivität der AC-3 Komprimierung steigt dabei mit der Anzahl der Kanäle.

Technik der AC-3 Mehrkanalkodierung

Hauptverantwortlich für die hervorragende Performance sind vor allem zwei Features

  • Global Bit Pool
    • über diesen Pool werden korrelierende Bits je nach Bedarf unter den verschiedenen Kanälen ausgetauscht.
  • Kopplung hoher Frequenzen
    • Diese Technik leitet sich von der perzeptuellen Eigenschaft unseres Ohres ab, dass oberhalb einer bestimmten Frequenz Töne, deren Frequenzen nahe beieinander liegen, von unserem Gehör örtlich nicht mehr voneinander getrennt werden können. Diese Frequenz beträgt 2 kHz und wird bei AC-3 als Kopplungsfrequenz bezeichnet. Zur Datenreduktion mit Hilfe dieses Effektes werden bei AC-3 die hohen Frequenzen aller Kanäle in einem eigenen Kanal als Monosignal kodiert. Dieser Kopplungskanal wird auf die gleiche Art und Weise komprimiert wie die anderen Kanäle. In den anderen Kanälen werden für die hohen Frequenzen nur mehr hörbare Differenzen gegenüber diesem Kopplungskanal kodiert.

Notes
(empty)