Current Page: Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: m04 » Learning Units » Unit ID: 03_11
Last Modified:Tuesday, 2015-05-05 - 08:09:11
 
Tools: ValidatePreview XML Preview HTML Preview PDF
Alternative: Printable HTML

 

Learning Unit ID: 03_11
Title: Subbandtechnik bei Audiokodierungstechnik
Abstract: Um die Erkenntnisse aus der Psychoakustik in effektive Datenreduktion ummünzen zu können, muss das Audiosignal erst in einer passenden Form dargestellt werden. Die Subbandtechnik berücksichtigt, dass unser Gehör den speziellen Charakter eines akustischen Ereignisses vorwiegend in dessen Spektralbereich erkennt. In der Lerneinheit wird beschrieben, wie ein Audiosignal mittels einer Filterbank in Subbands aufgeteilt wird und jedes Subband separat auf psychoakustische Eigenschaften hin untersucht wird. Als weitere Technik zur Datenkompression wird das "Companding", welche die Subbandtechnik effektiver macht, beschrieben.
 
Status: Final Version: 2004-11-05
History: 2004-11-05 (Thomas Migl): Acro added
2004-09-17 (Thomas Migl): fehlende Abb. hinzugefügt
2004-09-09 (Thomas Migl): 1 Abb. hinzugefügt
2004-08-16 (Robert Fuchs): Checked, fixed and exported for Review #2.
2004-08-02 (Thomas Migl): Importiert in greybox, neu getaggt, umformuliert, verlinkt
2004-03-12 (Robert Fuchs): Closed for 50% Content Deadline import in Scholion.
2004-03-11 (Thomas Migl): LOD1 Header teilweise hinzugefügt.
2004-03-05 (Robert Fuchs): Put sources into CorPU title where neccessary; removed dummy entries for LOD 3; added links.
2004-03-04 (Thomas Migl): Abstract hinzugefügt
2004-02-27 (HTMLContentTools): Replaced old numeric source refs by new alphanumeric ones.
2004-02-26 (Robert Fuchs) - Upgrade from old LU 415, version 2003-12-03.
2004-02-25 (HTMLContentTools) - Created skeleton page.
2003-12-03 (Robert Fuchs): Import von Version 2003-08-23 aus HTML Authoring Systeme v.1

Author
Author 1: Thomas Migl E-Mail: migl@ims.tuwien.ac.at
Author 2: (empty) E-Mail: (empty)
Author 3: (empty) E-Mail: (empty)
Author 4: (empty) E-Mail: (empty)
Author 5: (empty) E-Mail: (empty)
Organization: Technische Universität Wien; Institut für Softwaretechnik und Interaktive Systeme; Arbeitsgruppe für Interaktive Multimediale Systeme; http://www.ims.tuwien.ac.at/

Content

Was ist Subband Kodierung? watk2001, 293

1

auto

  • Evaluierung eines Audiosignals mittels Psychoakustik
  • geeignete Dastellung für Psychoakustik bietet
    • Subbandkodierung
      • Berücksichtigt spektrales Empfinden unseres Gehörs

Spektrales Hören

  • Grund spektraler Sensiblität
    • Art und Weise der Bewußrmachung von Schall
    • Unterschiedliche Regionen der Basilarmembran
      • Jede Region überträgt nur einen spezielles Frequenzbereich
      • Die Bandbreiten dieser Frequenzbänder ident mit der kritischen Bandbreiten
  • Simulation der spektralen Eigenschaft des menschlichen Hörens

Subbandkodierung zur Datenreduktion

  • Subbands, die keine Signalanteile enthalten, werden bei der Kodierung nicht berücksichtigt
  • Subbands, die nur Signalanteile enthalten, die von unserem Gehör nicht wahrgenommen werden, werden ebenfalls vernachlässigt
  • Subbands mit lauten Signalteilen haben hohen Maskierungseffekt . Es können daher kurze Wortlängen gewählt werden
  • Subbands, die nur leise Signalanteile haben, können mit kleineren Wortlängen kodiert werden. Dazu bedient man sich der Technik der Skalierung

2

auto

Um die Erkenntnisse aus der Psychoakustik in effektive Datenreduktion ummünzen zu können, muss das Audiosignal erst in einer passenden Form dargestellt werden. Als dafür sehr geeignet hat sich die Subbandtechnik erwiesen. Die Subbandtechnik berücksichtigt, dass unser Gehör den speziellen Charakter eines akustischen Ereignisses vorwiegend in dessen Spektralbereich erkennt.

Spektrales Hören

Der Grund für die starke spektrale Sensiblität unseres Gehörs liegt in der Art und Weise, wie es Schall unserem Gehirn bewußt macht. Die Schallwelle gelangt im Innenohr an Schallrezeptoren. Diese sind eine Unzahl kleiner Härchen, die sich auf der sogenannten Basilarmembran befinden. Die Härchen werden durch die Schallwelle in Schwingung versetzt. Dabei gilt: in unterschiedlichen Regionen der Basilarmembran reagieren die Härchen nur auf spezifische Frequenzen. Jede Region überträgt nur einen spezielles Frequenzbereich der Schallwelle. Die Bandbreiten dieser Frequenzbänder sind mit den der kritischen Bandbreiten ident. Die Bewegungen der verschiedenen Härchen werden getrennt kodiert und über den Gehörnerv an das Gehirn weitergegeben.

Simulation spektrales Hören

Die Subbandtechnik ist nichts anderes als eine Simulation der spektralen Eigenschaft des menschlichen Hörens. Eine größere Anzahl an Filtern (Filterbank) liefert die verschiedenen Frequenzbänder des Audiosignals. Idealerweise sollten die Bandbreiten dieser Bänder mit den kritischen Bandbreiten unsers Gehörs übereinstimmen.

Subbandkodierung zur Datenreduktion

Durch die Subbandkodierung können Signalanteile unterschiedlicher Frequenzbänder unabhängig voneinander auf ihre perzeptuellen Eigenschaften untersucht werden. Die wichtigsten Techniken der Datenreduktion mit Hilfe der Subbandkodierung sind

  • Subbands, die keine Signalanteile enthalten, werden bei der Kodierung nicht berücksichtigt
  • Subbands, die nur Signalanteile enthalten, die von unserem Gehör nicht wahrgenommen werden, werden ebenfalls vernachlässigt
  • Subbands mit lauten Signalteilen haben hohen Maskierungseffekt . Es können daher kurze Wortlängen gewählt werden
  • Subbands, die nur leise Signalanteile haben, können mit kleineren Wortlängen kodiert werden. Dazu bedient man sich der Technik der Skalierung

auto

Der Schlüssel zur hohen perzeptuellen Kompression von Audiodateien liegt allerdings in der Untersuchung der Maskierungseigenschaften der verschiedenen Subbands.

Filterbank bhas1997, 394

1

Filterbank PC

Filterbank PDA_Phone

Kritische Abtastung

  • Kritische Abtastung
    • Je mehr Subbands, desto geringer Abtastrate in Subbands
    • lässt sich durch Nyquist-Shannon-Theorem erklären
    • Filterbank keinen Einfluss auf Gesamtdatenrate!

2

Eine zentrale Rolle in der Subbandkodierung spielen die Filter, die als Simulation der spektralen Höreigenschaften das Audiosignal in Frequenzbänder unterteilen.

Filterbank PC

Dargestellte Filterbank zerteilt Audiosignal in 4 Frequenzbänder (Subbands).

  • Eingang: PCM Signal mit einem Frequenzbereich von 0 - 20kHz; Abtastrate 48 kHz; Wortlänge 16 Bit pro Abtastwert
  • Ausgang: 4 PCM Signale
    • Subband 1: 0Hz - 5kHz; Abtastrate 12kHz (!); 16 Bit pro Abtastwert
    • Subband 2: 5kHz -10 kHz; Abtastrate 12kHz (!); 16 Bit pro Abtastwert
    • Subband 3: 10kHz - 15 kHz; Abtastrate 12kHz (!); 16 Bit pro Abtastwert
    • Subband 4: 15 kHz - 20 kHz; Abtastrate 12kHz (!); 16 Bit pro Abtastwert

Filterbank PDA_Phone

Dargestellte Filterbank zerteilt Audiosignal in 4 Frequenzbänder (Subbands).

  • Eingang: PCM Signal mit einem Frequenzbereich von 0 - 20kHz; Abtastrate 48 kHz; Wortlänge 16 Bit pro Abtastwert
  • Ausgang: 4 PCM Signale
    • Subband 1: 0Hz - 5kHz; Abtastrate 12kHz (!); 16 Bit pro Abtastwert
    • Subband 2: 5kHz -10 kHz; Abtastrate 12kHz (!); 16 Bit pro Abtastwert
    • Subband 3: 10kHz - 15 kHz; Abtastrate 12kHz (!); 16 Bit pro Abtastwert
    • Subband 4: 15 kHz - 20 kHz; Abtastrate 12kHz (!); 16 Bit pro Abtastwert

Kritische Abtastung

Aus dem vorigen Beispiel sieht man, dass die Wortlänge der Abtastwerte in den Subbands zwar unverändert bleibt, aber die Abtastfrequenzen in den Subbands nur mehr 1:4 des Einganssignals betragen. Diese reduzierte Abtastrate der Subbändern bei digitalen Filterbank wird auch als kritische Abtastrate bezeichnet. Durch die Kritische Abtastung der Subbands ist gewährleistet, dass die Filterbank keinen Einfluss auf die Datenmenge hat: Es werden zwar mehr Kanäle erzeugt, aber deren Abtastfrequenzen sind dementsprechend geringer.

Kritische Abtastung für Filterbanken mit beliebig vielen Subbands

Das Prinzip der kritischen Abtastung ist für alle Filterbanken, unabhängig von der Anzahl der Subbands, gültig. die Abtastfrequenz der Subbands ist dabei verkehrt proportional zur Anzahl der Subbands.

wie entsteht kritische Abtastung?

Dass dieser Sachverhalt allgemein für Filterbanken gültig ist, lässt sich leicht aus dem Nyquist-Shannon-Theorem ableiten: Die Abtastfrequenz muss mindestens doppelt so groß sein, wie die Gesamtbandbreite des zu darstellenden Signals. Bei der Filterung in n Subbands wird die Bandbreite für ein Subband auf 1/n reduziert. Die Abtastrate für ein Subband muss dann nur mehr 1/n der ursprünglichen betragen.

Kritische Abtastung betreff Datenkomprimierung

Das Aufteilen eines digitalen Signals in mehrere Frequenzbänder mittels Filterbank verursacht keinerlei Änderung der Gesamtdatenrate!

Maskierung in Subbandswatk2001,294

1

auto

  • Maskierung ist Schlüssel der perzeptuellen Audiokompression
  • Maskierung in Subbändern mit lauten Signalkomponenten

Subbandbreite PC

  • Schmale Subbands
    • Hoher Schwellwert für das Quantisierungsrauschen
    • hohe Kompression

Subbandbreite PDA_Phone

  • Schmale Subbands
    • Hoher Schwellwert für das Quantisierungsrauschen
    • hohe Kompression

2

auto

Der Maskierungseffekt ist jener perzeptuelle Effekt, der hauptverantwortlich für die hohen Kompressionsraten gängiger Encoder ist. Man untersucht dabei für jedes Subband die Maskierungseigenschaften der darin enthaltenen Signalanteile.Bei Bändern mit lauten Signalanteilen findet starke Maskierung statt. Der maskierende Ton macht in seiner unmittelbaren Nähe liegende Töne, deren Lautstärke unter dem Maskierungsschwellwert liegen, für unser Ohr nicht hörbar. Auch das Quantisierungsrauschen, das unter diesem Schwellwert liegt, wird von unserem Gehör nicht wahrgenommen. Die Werte solcher Subbands können daher mit einer ensprechenden kurzen Wortlänge kodiert werden.

Subbandbreite PC

Einen hohen Einfluss auf die Maskierungseigenschaften hat die Breite eines Subbands. Da dieEffektivität des Maskierungseffektes eines Tones in unmittelbarer Nähe des Tones am höchsten ist, lässt ein schmales Subband ein höheres Quantisierungsrauschen als ein breites zu. Allgemein gilt: Je schmäler die Bandbreiten der Subbands gewählt werden, um so höher ist der Schwellwert für das Quantisierungsrauschen. Daraus leitet sich unmittelbar ab, dass man mit schmalen Subbands eine effektivere Datenkompression zu erwarten ist.

Subbandbreite PDA_Phone

Einen hohen Einfluss auf die Maskierungseigenschaften hat die Breite eines Subbands. Da dieEffektivität des Maskierungseffektes eines Tones in unmittelbarer Nähe des Tones am höchsten ist, lässt ein schmales Subband ein höheres Quantisierungsrauschen als ein breites zu. Allgemein gilt: Je schmäler die Bandbreiten der Subbands gewählt werden, um so höher ist der Schwellwert für das Quantisierungsrauschen. Daraus leitet sich unmittelbar ab, dass man mit schmalen Subbands eine effektivere Datenkompression zu erwarten ist.

Companding/Skalierung watk2001, 289

1

Companding

Companding in analoger Audiotechnik

  • Rauschunterdrückungssystem für Tonbandgeräte
  • kleine Signalanteile verstärkt
  • Verbesserter SNR 396 bezüglich Bandrauschen
  • Bei Wiedergabe Bandrauschen gedämpft

Companding in digitaler Audiotechnik/Skalierung

2

Companding

Companding ist die einfachste Technik zur Audiokomprimierung. Sie wurde ursprünglich entwickelt zur Rauschunterdrückung bei analogen Tonbandgeräten (z.B. Dolby A, B, C bei Audio-Cassettenrekorder).

Companding in analoger Audiotechnik

Auch bei analoger Rauschunterdrückungssytemen wird zur Steigerung des Effektes die Subbandtechnik verwendet. Es wird vor dem Companding das Audiosignal in mehrere Frequenzbänder aufgeteilt. Die kleinen Signalanteile werden mit einem für das entsprechende Band spezifischen Faktor verstärkt.

Problem bei Analoger Bandaufzeichnung

Um eine möglichst rauschfreie Bandaufzeichnug zu erhalten, muss das Audiosignal einen wesentlichen höheren Pegel haben als das Rauschen des Magnetbandes. Bei lauten Stellen ist das kein Problem, bei leisen Stellen ist die Pegeldifferenz SNR aber meist gering, das Signal klingt verrauscht (siehe Grundlagen der digitalen Audiotechnik).

Abhilfe durch Companding

Bevor das Audiosignal auf das Band gespielt wird, wird es "companded". Laute Signalanteile bleiben unverändert. Leisere Signalanteile hingegen werden mit einem bestimmten Faktor verstärkt. In dieser Form wird das Signal auf das Band überspielt. Die SNR der leisen Signalanteile hat sich durch das Companden vergrößert. Zur originalgetreuen Wiedergabe werden die leisen Signalanteile mit dem selben Faktor wieder gedämpft. Auch das Bandrauschen wird mit dem selben Faktor gedämpft.

Companding in digitaler Audiotechnik/Skalierung

Für digitale Audiokompression wurde das Prinzip des Compandings unter der Bezeichnung Skalierung übernommen. Companding zeigt seinen höchsten Effekt in Subbändern mit sehr kleinen Werten. Durch das Companding können kleinen Werten auch dementsprechend kurze Wortlängen zugeordnet werden. Kleine Signalteile werden vor der eigentlichen Kompression ähnlich wie bei der analogen Technik mit einem bestimmten Fakor verstärkt. Dieser Faktor wird als Skalierfaktor bezeichnet. Bei der nachfolgenden Ermittlung des maximal erlaubten Quantisierungsrauschen kann ein dem Skalierfaktor entsprechender höherer Wert gewählt werden und damit den Werten eine kleinere Wortlänge zugeordnet werden.Für eine originalgetreue Wiedergabe werden die Werte mit dem Skalierfaktor wieder gedämpft. Auch das Quantisierungsrauschen wird mit gleichen Faktor gedämpft.


Notes
(empty)