Current Page: | Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: m04 » Learning Units » Unit ID: 03_11 |
---|---|
Last Modified: | Tuesday, 2015-05-05 - 08:09:11 |
Tools: | Validate — Preview XML Preview HTML Preview PDF |
Alternative: | Printable HTML |
Title: | Subbandtechnik bei Audiokodierungstechnik | ||
---|---|---|---|
Abstract: | Um die Erkenntnisse aus der Psychoakustik in effektive Datenreduktion ummünzen zu können, muss das Audiosignal erst in einer passenden Form dargestellt werden. Die Subbandtechnik berücksichtigt, dass unser Gehör den speziellen Charakter eines akustischen Ereignisses vorwiegend in dessen Spektralbereich erkennt. In der Lerneinheit wird beschrieben, wie ein Audiosignal mittels einer Filterbank in Subbands aufgeteilt wird und jedes Subband separat auf psychoakustische Eigenschaften hin untersucht wird. Als weitere Technik zur Datenkompression wird das "Companding", welche die Subbandtechnik effektiver macht, beschrieben. | ||
Status: | Final | Version: | 2004-11-05 |
History: | 2004-11-05
(Thomas Migl): Acro added 2004-09-17 (Thomas Migl): fehlende Abb. hinzugefügt 2004-09-09 (Thomas Migl): 1 Abb. hinzugefügt 2004-08-16 (Robert Fuchs): Checked, fixed and exported for Review #2. 2004-08-02 (Thomas Migl): Importiert in greybox, neu getaggt, umformuliert, verlinkt 2004-03-12 (Robert Fuchs): Closed for 50% Content Deadline import in Scholion. 2004-03-11 (Thomas Migl): LOD1 Header teilweise hinzugefügt. 2004-03-05 (Robert Fuchs): Put sources into CorPU title where neccessary; removed dummy entries for LOD 3; added links. 2004-03-04 (Thomas Migl): Abstract hinzugefügt 2004-02-27 (HTMLContentTools): Replaced old numeric source refs by new alphanumeric ones. 2004-02-26 (Robert Fuchs) - Upgrade from old LU 415, version 2003-12-03. 2004-02-25 (HTMLContentTools) - Created skeleton page. 2003-12-03 (Robert Fuchs): Import von Version 2003-08-23 aus HTML Authoring Systeme v.1 |
Author 1: | Thomas Migl | E-Mail: | migl@ims.tuwien.ac.at |
---|---|---|---|
Author 2: | (empty) | E-Mail: | (empty) |
Author 3: | (empty) | E-Mail: | (empty) |
Author 4: | (empty) | E-Mail: | (empty) |
Author 5: | (empty) | E-Mail: | (empty) |
Organization: | Technische Universität Wien; Institut für Softwaretechnik und Interaktive Systeme; Arbeitsgruppe für Interaktive Multimediale Systeme; http://www.ims.tuwien.ac.at/ |
Was ist Subband Kodierung? watk2001, 2931auto
Spektrales Hören
Subbandkodierung zur Datenreduktion
2autoUm die Erkenntnisse aus der Psychoakustik in effektive Datenreduktion ummünzen zu können, muss das Audiosignal erst in einer passenden Form dargestellt werden. Als dafür sehr geeignet hat sich die Subbandtechnik erwiesen. Die Subbandtechnik berücksichtigt, dass unser Gehör den speziellen Charakter eines akustischen Ereignisses vorwiegend in dessen Spektralbereich erkennt. Spektrales HörenDer Grund für die starke spektrale Sensiblität unseres Gehörs liegt in der Art und Weise, wie es Schall unserem Gehirn bewußt macht. Die Schallwelle gelangt im Innenohr an Schallrezeptoren. Diese sind eine Unzahl kleiner Härchen, die sich auf der sogenannten Basilarmembran befinden. Die Härchen werden durch die Schallwelle in Schwingung versetzt. Dabei gilt: in unterschiedlichen Regionen der Basilarmembran reagieren die Härchen nur auf spezifische Frequenzen. Jede Region überträgt nur einen spezielles Frequenzbereich der Schallwelle. Die Bandbreiten dieser Frequenzbänder sind mit den der kritischen Bandbreiten ident. Die Bewegungen der verschiedenen Härchen werden getrennt kodiert und über den Gehörnerv an das Gehirn weitergegeben. Simulation spektrales HörenDie Subbandtechnik ist nichts anderes als eine Simulation der spektralen Eigenschaft des menschlichen Hörens. Eine größere Anzahl an Filtern (Filterbank) liefert die verschiedenen Frequenzbänder des Audiosignals. Idealerweise sollten die Bandbreiten dieser Bänder mit den kritischen Bandbreiten unsers Gehörs übereinstimmen. Subbandkodierung zur DatenreduktionDurch die Subbandkodierung können Signalanteile unterschiedlicher Frequenzbänder unabhängig voneinander auf ihre perzeptuellen Eigenschaften untersucht werden. Die wichtigsten Techniken der Datenreduktion mit Hilfe der Subbandkodierung sind
autoDer Schlüssel zur hohen perzeptuellen Kompression von Audiodateien liegt allerdings in der Untersuchung der Maskierungseigenschaften der verschiedenen Subbands. Filterbank bhas1997, 3941Filterbank PCFilterbank PDA_PhoneKritische Abtastung
2Eine zentrale Rolle in der Subbandkodierung spielen die Filter, die als Simulation der spektralen Höreigenschaften das Audiosignal in Frequenzbänder unterteilen. Filterbank PCDargestellte Filterbank zerteilt Audiosignal in 4 Frequenzbänder (Subbands).
Filterbank PDA_PhoneDargestellte Filterbank zerteilt Audiosignal in 4 Frequenzbänder (Subbands).
Kritische AbtastungAus dem vorigen Beispiel sieht man, dass die Wortlänge der Abtastwerte in den Subbands zwar unverändert bleibt, aber die Abtastfrequenzen in den Subbands nur mehr 1:4 des Einganssignals betragen. Diese reduzierte Abtastrate der Subbändern bei digitalen Filterbank wird auch als kritische Abtastrate bezeichnet. Durch die Kritische Abtastung der Subbands ist gewährleistet, dass die Filterbank keinen Einfluss auf die Datenmenge hat: Es werden zwar mehr Kanäle erzeugt, aber deren Abtastfrequenzen sind dementsprechend geringer. Kritische Abtastung für Filterbanken mit beliebig vielen SubbandsDas Prinzip der kritischen Abtastung ist für alle Filterbanken, unabhängig von der Anzahl der Subbands, gültig. die Abtastfrequenz der Subbands ist dabei verkehrt proportional zur Anzahl der Subbands. wie entsteht kritische Abtastung?Dass dieser Sachverhalt allgemein für Filterbanken gültig ist, lässt sich leicht aus dem Nyquist-Shannon-Theorem ableiten: Die Abtastfrequenz muss mindestens doppelt so groß sein, wie die Gesamtbandbreite des zu darstellenden Signals. Bei der Filterung in n Subbands wird die Bandbreite für ein Subband auf 1/n reduziert. Die Abtastrate für ein Subband muss dann nur mehr 1/n der ursprünglichen betragen. Kritische Abtastung betreff DatenkomprimierungDas Aufteilen eines digitalen Signals in mehrere Frequenzbänder mittels Filterbank verursacht keinerlei Änderung der Gesamtdatenrate! Maskierung in Subbandswatk2001,2941auto
Subbandbreite PC
Subbandbreite PDA_Phone
2autoDer Maskierungseffekt ist jener perzeptuelle Effekt, der hauptverantwortlich für die hohen Kompressionsraten gängiger Encoder ist. Man untersucht dabei für jedes Subband die Maskierungseigenschaften der darin enthaltenen Signalanteile.Bei Bändern mit lauten Signalanteilen findet starke Maskierung statt. Der maskierende Ton macht in seiner unmittelbaren Nähe liegende Töne, deren Lautstärke unter dem Maskierungsschwellwert liegen, für unser Ohr nicht hörbar. Auch das Quantisierungsrauschen, das unter diesem Schwellwert liegt, wird von unserem Gehör nicht wahrgenommen. Die Werte solcher Subbands können daher mit einer ensprechenden kurzen Wortlänge kodiert werden. Subbandbreite PCEinen hohen Einfluss auf die Maskierungseigenschaften hat die Breite eines Subbands. Da dieEffektivität des Maskierungseffektes eines Tones in unmittelbarer Nähe des Tones am höchsten ist, lässt ein schmales Subband ein höheres Quantisierungsrauschen als ein breites zu. Allgemein gilt: Je schmäler die Bandbreiten der Subbands gewählt werden, um so höher ist der Schwellwert für das Quantisierungsrauschen. Daraus leitet sich unmittelbar ab, dass man mit schmalen Subbands eine effektivere Datenkompression zu erwarten ist. Subbandbreite PDA_PhoneEinen hohen Einfluss auf die Maskierungseigenschaften hat die Breite eines Subbands. Da dieEffektivität des Maskierungseffektes eines Tones in unmittelbarer Nähe des Tones am höchsten ist, lässt ein schmales Subband ein höheres Quantisierungsrauschen als ein breites zu. Allgemein gilt: Je schmäler die Bandbreiten der Subbands gewählt werden, um so höher ist der Schwellwert für das Quantisierungsrauschen. Daraus leitet sich unmittelbar ab, dass man mit schmalen Subbands eine effektivere Datenkompression zu erwarten ist. Companding/Skalierung watk2001, 2891CompandingCompanding in analoger Audiotechnik
Companding in digitaler Audiotechnik/Skalierung
2CompandingCompanding ist die einfachste Technik zur Audiokomprimierung. Sie wurde ursprünglich entwickelt zur Rauschunterdrückung bei analogen Tonbandgeräten (z.B. Dolby A, B, C bei Audio-Cassettenrekorder). Companding in analoger AudiotechnikAuch bei analoger Rauschunterdrückungssytemen wird zur Steigerung des Effektes die Subbandtechnik verwendet. Es wird vor dem Companding das Audiosignal in mehrere Frequenzbänder aufgeteilt. Die kleinen Signalanteile werden mit einem für das entsprechende Band spezifischen Faktor verstärkt. Problem bei Analoger BandaufzeichnungUm eine möglichst rauschfreie Bandaufzeichnug zu erhalten, muss das Audiosignal einen wesentlichen höheren Pegel haben als das Rauschen des Magnetbandes. Bei lauten Stellen ist das kein Problem, bei leisen Stellen ist die Pegeldifferenz SNR aber meist gering, das Signal klingt verrauscht (siehe Grundlagen der digitalen Audiotechnik). Abhilfe durch CompandingBevor das Audiosignal auf das Band gespielt wird, wird es "companded". Laute Signalanteile bleiben unverändert. Leisere Signalanteile hingegen werden mit einem bestimmten Faktor verstärkt. In dieser Form wird das Signal auf das Band überspielt. Die SNR der leisen Signalanteile hat sich durch das Companden vergrößert. Zur originalgetreuen Wiedergabe werden die leisen Signalanteile mit dem selben Faktor wieder gedämpft. Auch das Bandrauschen wird mit dem selben Faktor gedämpft. Companding in digitaler Audiotechnik/SkalierungFür digitale Audiokompression wurde das Prinzip des Compandings unter der Bezeichnung Skalierung übernommen. Companding zeigt seinen höchsten Effekt in Subbändern mit sehr kleinen Werten. Durch das Companding können kleinen Werten auch dementsprechend kurze Wortlängen zugeordnet werden. Kleine Signalteile werden vor der eigentlichen Kompression ähnlich wie bei der analogen Technik mit einem bestimmten Fakor verstärkt. Dieser Faktor wird als Skalierfaktor bezeichnet. Bei der nachfolgenden Ermittlung des maximal erlaubten Quantisierungsrauschen kann ein dem Skalierfaktor entsprechender höherer Wert gewählt werden und damit den Werten eine kleinere Wortlänge zugeordnet werden.Für eine originalgetreue Wiedergabe werden die Werte mit dem Skalierfaktor wieder gedämpft. Auch das Quantisierungsrauschen wird mit gleichen Faktor gedämpft. |
(empty) |