Current Page: | Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: m04 » Learning Units » Unit ID: 03_14 |
---|---|
Last Modified: | Tuesday, 2015-05-05 - 08:09:08 |
Tools: | Validate — Preview XML Preview HTML Preview PDF |
Alternative: | Printable HTML |
Title: | MPEG-2 Audio/AAC | ||
---|---|---|---|
Abstract: | AAC steht für "Advanced Audio Coding" und wird im MPEG-2 Standard beschrieben. Die Besonderheiten von AAC sind seine modulare Aufbauweise, durch die eine große Flexibilität für die verschiedensten Anwendungen gewährleistet ist, und die Module selbst, die verantwortlich sind für die große Qualitätssteigerung gegenüber MP3. | ||
Status: | Final for Review #2 - captions missing | Version: | 2004-11-04 |
History: |
2004-11-04 (Thomas Migl): Acro added 2004-10-14 (Thomas migl): pda Abb. hinzugefügt 2004-09-23 (thomas migl): Abb. explanations korrigiert 2004-09-17 (Thomas Migl): 1 pda Abbildung hinzugefügt 2004-09-09 (thomas Migl): Abb hinzugefügt, Überschriften geändert 2004-08-16 (Robert Fuchs): Checked, fixed and exported for Review #2. 2004-08-04 (Thomas Migl): in Greybox importiert, bis auf Abb. finalisiert 2004-03-12 (Robert Fuchs): Closed for 50% Content Deadline import in Scholion. 2004-03-12 (Robert Fuchs): Fixed bugs in content tagging; nested list bug. 2004-03-11 (Thomas Migl): LOD1 Headers added 2004-03-05 (Thomas Migl): Abstract hinzugefügt 2004-03-05 (Robert Fuchs): Put sources into CorPU title where neccessary; added links. 2004-02-27 (HTMLContentTools): Replaced old numeric source refs by new alphanumeric ones. 2004-02-26 (Robert Fuchs) - Upgrade from old LU 440, version 2003-12-03. 2004-02-25 (HTMLContentTools) - Created skeleton page. 2003-12-03 (Robert Fuchs): Import von Version 2003-08-23 aus HTML Authoring Systeme v.1 |
Author 1: | Thomas Migl | E-Mail: | migl@ims.tuwien.ac.at |
---|---|---|---|
Author 2: | (empty) | E-Mail: | (empty) |
Author 3: | (empty) | E-Mail: | (empty) |
Author 4: | (empty) | E-Mail: | (empty) |
Author 5: | (empty) | E-Mail: | (empty) |
Organization: | Technische Universität Wien; Institut für Softwaretechnik und Interaktive Systeme; Arbeitsgruppe für Interaktive Multimediale Systeme; http://www.ims.tuwien.ac.at/ |
AAC Einführung watk2001, 3161auto
AAC im Vergleich zu MP3Von MP3 übernommen wurden
Neu eingeführt wurden
Zusätzliche Features im MPEG-2 Standard
2autoAAC steht für Advanced Audio Coding, und wird im MPEG-2 Standard, Teil 7 beschrieben. Zielsetzung war die Entwicklung eines Audiokomprimierungstandards, der höchstmögliche Performance bezüglich Klangqualität und Kompression bietet. Um ein optimales Ergebnis zu erzielen, wurde keine Rücksicht auf Rückwärtskompatibilität bezüglich des MPEG-1 Audiostandards genommen. So konnten zwar geeignete Teile von MP3 übernommen werden, andere aber wieder durch verbesserte Tools ersetzt werden. AAC im Vergleich zu MP3Als Faustregel gilt: AAC benötigt eine im Vergleich zu MP3 um 30% geringere Datenrate um eine äquivalente Qualität zu erzielen.bran2000 Von MP3 übernommen wurden:
Neu eingeführt wurden: bran2000
Zusätzliche Features im MPEG-2 StandardMPEG-2 ist mit folgenden zusätzlichen Features ausgestattet: bhas1997, 369
Blockschaltbild AAC Encoder1Abbildung: Blockschaltbild eines AAC Encoders PCAbbildung: Blockschaltbild eines AAC Encoders PDA_Phone2Blockschaltbild eines AAC EncodersDas Blockbild zeigt, das ein AAC Encoder stark modular aufgebaut ist. Nicht alle Module müssen benutzt werden. Je nach Erfordernissen der Anwendung werden benötigte Module ausgewählt.Die möglichen Zusammensetzungen der Module werden in den Profiles von AAC beschrieben. Das Signal durchläuft die verschiedenen Module. Jedes Modul bearbeitet das Signal und übermittelt die von ihm geforderten Daten an den Formatter, die dieser benötigt, um den Datenstrom zu generieren. Parallel dazu wird das Signal dem psychoakustischem Modell zugeführt. Das psychoakustische Modell kann Daten an jedes einzelne Modul schicken. Blockschaltbild eines AAC Encoders PCBlockschaltbild eines AAC EncodersPDA_PhoneAbbildung: Blockschaltbild eines AAC EncodersDas Blockbild zeigt, das ein AAC Encoder stark modular aufgebaut ist. Nicht alle Module müssen benutzt werden. Je nach Erfordernissen der Anwendung werden benötigte Module ausgewählt.Die möglichen Zusammensetzungen der Module werden in den Profiles von AAC beschrieben. Das Signal durchläuft die verschiedenen Module. Jedes Modul bearbeitet das Signal und übermittelt die von ihm geforderten Daten an den Formatter, die dieser benötigt, um den Datenstrom zu generieren. Parallel dazu wird das Signal dem psychoakustischem Modell zugeführt. Das psychoakustische Modell kann Daten an jedes einzelne Modul schicken. Module1Filterbank
TNS
Abbildung:Prädiktion in Abhängigkeit der Signalform PCAbbildung:Prädiktion in Abhängigkeit der SignalformPDA_PhoneIntensity und M/S Modul - flexible Joint Stereo KodierungIntensitäts und M/S ModulAAC bietet eine Verbesserung gegenüber MP3 durch eine flexiblere Joint Stereo Codierung. Dazu verwendet es zwei Module:
M/S und IntensitätskodierungBei beiden Methoden wird der räumliche Charakter eines Audiosignals mit Hilfe von 2 Kanälen kodiert. Bei der Intensitätskodierung sind die Kanäle mit linkem und rechtem Signal belegt. Bei der M/S Stereofonie (Mitte/Seite) ist in einem Kanal (Mitte) das Monosignal kodiert, im anderen(Seite) sind Informationen, mit deren Hilfe der Decoder aus Mitten und Seitensignal das stereofone Original regenerieren kann. Prädiktions Modul bran2000, 6Ist ein optionales Modul und wird nur im main profile verwendet (siehe Profiles). Das Prädiktionsmodul hat seine größte Effektivität bei Audiosignalen, die einen starken tonalen Charakter haben (z.B. Stimmpfeife). Funktionsweise PrädiktionsmodulEs wird eine Prädiktion auf aufeinanderfolgende Datenblöcke (Daten innerhalb eines Fensters) angewandt. Zur Prädiktion eines Blockes werden die bereits quantisierten Koeffizienten, die sich an der gleichen Stelle innerhalb des Blockes befinden, der beiden vorhergegangenen Blöcke herangezogen. Es werden die korrespondierenden Koeffizienten subtrahiert, die Differenzen übertragen.
Prädiktionsmodul2Filterbank watk2001, 318AAC verwendet keine polyphase Filterbank. Stattdessen kommt eine einzige MDCT (siehe Transformation) zum Einsatz, die im Gegensatz zur polyphasen Filterbank von MP3 vollkommen verlustfrei arbeitet. Es wird wie bei MP3 mit variabler Fensterlänge gearbeitet. Auch hier gilt, je länger das Fenster,desto mehr Subbands können erzeugt werden und um so höher wird die Kompression ausfallen, aber auch um so größer ist die Gefahr, daß ein Pre-Echo entsteht. Das Filter ist so dimensioniert, dass das Pre-Echo im Vergleich zu MP3 reduziert wurde. TNS Modul watk2001, 319Dieses Modul ist hauptverantwortlich für die enorme qualitative Steigerung von AAC gegenüber MP3. Es steuert den zeitlichen Verlauf des Quantisierungsrauschens (=Temporal Noise Shaping). Die große Schwachstelle bei Encodern wie MP3 sind Signalstellen, an denen sich ein starker Signalanstieg befindet. Um Pre-Echo zu vermeiden, muss ein kurzes Fenster gewählt werden, die Kompression in diesem Fensters ist aber sehr mäßig (Siehe Fenster in MP3). Aus der Erkenntnis, dass aber gerade an solchen Signalstellen die Frequenzkomponenten untereinander eine hohe Redundanz aufweisen, benutzt das TNS Modul zur Kodierung solcher Signalabschnitte eine ausgeklügelte Prädiktionstechnik, sodass auch an solchen Stellen eine hohe Kompression möglich wird. TNS FunktionsweiseAbbildung:Prädiktion in Abhängigkeit der SignalformDie TNS Prädiktionstechnik berücksichtigt, daß Signalabschnitte mit starken zeitlichen Anstiegen im Frequenzbereich leichter zu prädizieren sind, da eine Spitze im Zeitverlauf einem kontinuierlichen Verlauf im Frequenzbereich entspricht, das eine genaue Prädiktion ermöglicht (Im Gegenzug sind kontinuierliche Signalabschnitte im Zeitbereich leichter zu prädizieren). Das TNS Modul spielt seine Stärken bei Signalabschnitten mit steilen Anstiegen aus. Durch das TNS Modul werden auch Signalabschnitte mit starken Spitzen hoch komprimiert, ohne daß das gefürchtete Pre-Echo hörbar wird. Abbildung:Prädiktion in Abhängigkeit der Signalform PCAbbildung:Prädiktion in Abhängigkeit der Signalform PDA_Phone
Intensitäts und M/S ModulAAC bietet eine Verbesserung gegenüber MP3 durch eine flexiblere Joint Stereo Codierung. Dazu verwendet es zwei Module:
M/S und IntensitätskodierungBei beiden Methoden wird der räumliche Charakter eines Audiosignals mit Hilfe von 2 Kanälen kodiert. Bei der Intensitätskodierung sind die Kanäle mit linkem und rechtem Signal belegt. Bei der M/S Stereofonie (Mitte/Seite) ist in einem Kanal (Mitte) das Monosignal kodiert, im anderen(Seite) sind Informationen, mit deren Hilfe der Decoder aus Mitten und Seitensignal das stereofone Original regenerieren kann. Prädiktions Modul bran2000, 6Ist ein optionales Modul und wird nur im main profile verwendet (siehe Profiles). Das Prädiktionsmodul hat seine größte Effektivität bei Audiosignalen, die einen starken tonalen Charakter haben (z.B. Stimmpfeife). Funktionsweise PrädiktionsmodulEs wird eine Prädiktion auf aufeinanderfolgende Datenblöcke (Daten innerhalb eines Fensters) angewandt. Zur Prädiktion eines Blockes werden die bereits quantisierten Koeffizienten, die sich an der gleichen Stelle innerhalb des Blockes befinden, der beiden vorhergegangenen Blöcke herangezogen. Es werden die korrespondierenden Koeffizienten subtrahiert, die Differenzen übertragen. Profiles watk2001, 3161auto
2autoDas AAC Konzept basiert auf einer Anzahl von Kodierungstools, die als Module bezeichnet werden. Durch unterschiedliche Kombinationen der Module können Datenströme in drei verschiedenen Profiles produziert werden. Main ProfileDas Main Profile erfordert den komplexesten Encoder. Es werden alle zur Verfügung stehenden Module genutzt. Low Complexity Profile (LC) bhas1997, 369Um die Anforderungen an Rechen- und Speicherleistung zu reduzieren, wird in diesem Profile nur ein Teil der zur Verfügung stehenden Module verwendet, bzw. Module nur in eingeschränkter Form eingesetzt. Skalierbare Abtastrate Profile (SSR)In diesem Profile wird das Audiosignal durch ein Filter auf vier gleichgroße Frequenzbereiche aufgeteilt. Jedes der vier Signale wird als ein eigener Bitstream kodiert. Ein Encoder kann jetzt je nach Komplexität für sich das Signal mit passender Abtastrate rekonstruieren. Je geringer Komplexität, um so geringer wird die Abtastrate und damit der darstellbare Frequenzbereich sein. |
(empty) |