Current Page: | Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: m04 » Learning Units » Unit ID: 01_01 |
---|---|
Last Modified: | Tuesday, 2015-05-05 - 08:09:06 |
Tools: | Validate — Preview XML Preview HTML Preview PDF |
Alternative: | Printable HTML |
Title: | Motivation und Überblick | ||
---|---|---|---|
Abstract: | Ziel der Kompression ist es, durch verschiedene Verfahren das Datenvolumen digitaler Dateien zu reduzieren. Multimediadaten (Video, Bilder, Audio) benötigen beträchtlichen Speicherplatz. Durch Kompression, das heißt gezielte Reduktion der Datengröße, können auch digitale Audio-, Video und Bilddaten einerseits gespeichert werden, andererseits können sie über verschiedenste Medien übertragen werden. Diese Lerneinheit definiert grundlegende Begriffe und bietet einen Überblick zur Klassifizierung der grundlegenden Datenkompressionstechniken. | ||
Status: | Final for Review #2 | Version: | 2005-01-07 |
History: | 2005-01-07
(Thomas Migl): CorPu "Überblick" hinzugefügt 2004-08-16 (Robert Fuchs): Checked, fixed and exported for Review #2. 2004-07-30 (Robert Fuchs): Bugfixes for Validate. 2004-07-22 (Robert Fuchs): Closed for XML validation for 100% Content Deadline import in Scholion. 2004-07-22 (Robert Fuchs): Manual import into the Greybox; input from Maia's review; some more adjustments and corrections. 2004-03-12 (Robert Fuchs): Closed for 50% Content Deadline import in Scholion. 2004-03-12 (Robert Fuchs): Fixed bugs in content tagging. 2004-03-11 (Thomas Migl): LOD1 Header hinzugefügt. 2004-03-05 (Robert Fuchs): Removed unused blocks (=newlines) from LOD 1. 2004-03-04 (Thomas Migl): LOD1 + Abstract. 2004-03-02 (Robert Fuchs): Imported and tagged content from "m4-LU01-Motivation und Überblick-fertig.doc". 2004-02-25 (HTMLContentTools): Created skeleton page. |
Author 1: | Hannes Eichner | E-Mail: | (empty) |
---|---|---|---|
Author 2: | Thomas Migl | E-Mail: | migl@ims.tuwien.ac.at |
Author 3: | (empty) | E-Mail: | (empty) |
Author 4: | (empty) | E-Mail: | (empty) |
Author 5: | (empty) | E-Mail: | (empty) |
Organization: | Technische Universität Wien; Institut für Softwaretechnik und Interaktive Systeme; Arbeitsgruppe für Interaktive Multimediale Systeme; http://www.ims.tuwien.ac.at/ |
Motivation1Ziel der Kompression multimedialer Daten
Anwendungen
2Ziel der Kompression multimedialer DatenZiel der Kompression ist es, durch verschiedene Verfahren das Datenvolumen zu reduzieren. Multimediadaten (Video, Bilder, Audio) benötigen beträchtlichen Speicherplatz. Durch Kompression, das heißt gezielte Reduktion der Datengröße, können auch digitale Audio-, Video und Bilddaten einerseits gespeichert werden, andererseits können sie über verschiedenste Medien übertragen werden.Modul „Komprimierung von Mulzuimediadaten“ bietet den Studenten einen Einblick in die Funktionsweisen der unterschiedlichen Algorithmen zur Datenkompression und Kodierung multimedialer Daten. Hauptaugenmerk wird dabei auf die Standards der ISO135 gelegt: MPEG31 (für Video und Audio), JPEG29 und JPEG2000 (für Bild). AnwendungenAudioAudiodateien können als komprimierte Dateien via Internet übertragen werden. Internetradiostationen können via Telefonleitungen empfangen werden, ohne dass die Qualität des Audiosignals trotz geringer Bandbreite des Mediums stark beeinträchtigt ist. Auch digitales Radio (terrestrisch, Satellitenempfang) ist nur mit komprimierten Audiodateien möglich. BilderBilder können auf Webseiten ohne störende Wartezeiten angezeigt werden. Kleine digitale Fotokameras speichern Fotos auf einem internen Speichermedium. VideoAbendfüllende Spielfilme können auf einer einzigen DVD gespeichert werden, Komprimierte Videodaten erlauben die Vorteile des digitalen Fernsehens zu nutzen (siehe Lerneinheiten Video- und Fernsehnormen, Der MPEG-2 Standard und MPEG-2 Levels und Profiles). Stark komprimiertes Video ermöglicht Broadcasting im Internet. Überblick1auto
2autoDas Modul „Komprimierung von Multimedia Daten“ besteht aus 35 Lerneinheiten und befasst sich mit 4 Hauptthemen: Basistechniken zur Datenkompression, Audiokompression, Bildkompression und Videokompression. Im Folgenden wird ein kurzer Überblick über die abgehandelten Themen gegeben. BasistechnikenHier lernt die Studentin grundlegende Techniken zur Datenreduktion. Die beschriebenen Algorithmen können unabhängig vom Datentyp angewendet werden, d.h. sie können bei Audiodaten genauso wie bei Video- oder Bilddaten zum Zwecke der Datenreduktion verwendet werden. In den meisten multimedialen Anwendungen gehen diese Algorithmen dann als Teil einer Hybridkodierung903 in die Berechnung ein. Eine wichtige Basistechnik ist die Entropiekodierung (Lauflängen-, Huffman-, LZ- und LZW- und Arithmetische Kodierung), die es erlaubt, statistische Redundanzen zu beseitigen. Eine ebenfalls elementare Technik ist die Transformationskodierung. Es findet hier allerdings keine eigentliche Kompression statt, vielmehr werden hier durch geeignete mathematische Prozeduren multimediale Inhalte in alternative Repräsentationsformen transferiert, welche eine effektivere Datenreduktion versprechen. Es werden die Fouriertransformation - inklusive deren Derivate wie Diskrete Fouriertransformation (DFT), Fast Fouriertransformation (FFT), Short Time Transform (STT), Diskrete Cosinustransformation (DCT) - und die Wavelettransformation im Detail besprochen. AudiokompressionDas Zauberwort der Audiokompression heißt „Perzeptuelle Kodierung“: Die Algorithmen nutzen die perzeptuellen Eigenschaften des menschlichen Hörsystems. Psychoakustische Erkenntnisse liefern dabei die Grundlagen, um entscheiden zu können, welche Werte kodiert werden müssen und welche Werte weggelassen werden können, da sie ohnehin von unserem Ohr nicht gehört werden. Um diese Techniken im Detail verstehen zu können, erfährt man hier über Psychoakustik, Quantisierungsrauschen, Signal to Noise ratio, Nyquist-Shannon Theorem, Subbandkodierung, Filterbanken und Skalierung des Dynamikbereiches eines Audiosignals. Als Vertreter einfach aufgebauter Encoder werden hier MPEG-1/Audio Layer1 und Layer2 beschrieben. Der hochkomprimierende MP3 Encoder ist zwar auf derselben simplen Architektur aufgebaut, ist aber in seiner Funktionsweise weitaus komplexer. Er verwendet eine höchst anspruchsvolle Iterationstechnik um Wortlänge und Skalierung der Werte zu berechnen. Weiters werden die Subbands mittels einer zusätzlichen MDCT493 in feinere Frequenzbänder aufgelöst, eine anschließende Huffmankodierung erhöht den möglichen Kompressionsfaktor. MPEG-2/AAC ist eine vollkommene neue MPEG Architektur, die keine Rücksicht auf Rückwärtskompatibilität in Bezug auf MPEG-1/Audio nimmt. Grundsätzlich folgt AAC18 den selben Paradigmen wie MP3, nur in verbesserter Form. Als einziger nicht-MPEG Encoder wird hier der AC-3 Encoder der Firma Dolby vorgestellt. Er spielt eine dominante Rolle für Kinoproduktionen, und somit auch für Video-DVDs und zukünftig auch für digitales Fernsehen. Eine Lerneinheit beschreibt den MPEG-4/Audio Standard. MPEG-4 ist einerseits eine Erweiterung des MPEG-2 Standards, andererseits führt er die „objektorientierte Kodierung“ ein. Es gibt eigene Tools für Sprachkodierung (z.B. CELP452), synthetische Klänge, synthetische Sprache. BildkompressionJPEG ist zurzeit der weltweit am meist verbreitete Standard für digitale Bilder. Ähnlich wie bei Audiokompressionsalgorithmen, werden perzeptuelle Eigenschaften des menschlichen Seesinns zur Datenreduktion genützt. Das Herz der JPEG Architektur ist die DCT242. Sie transformiert die Helligkeit/Farbwerte der Bildpunkte in Frequenzwerte, die Aufschluss über die Struktur des betrachteten Bildabschnittes geben und sich für eine Datenkompression besser eignen. Der Transformation folgt die Quantisierung (entspricht perzeptueller Bewertung) und wahlweise Huffman- oder Arithmetische Kodierung (siehe Entropiekodierung). JPEG2000 ist der neue ISO135 Standard und sollte JPEG29 allmählich ablösen. JPEG2000 arbeitet mit einer Wavelettransformation, die eine bessere Performance vor allem bei höheren Kompressionsraten liefert, da hier keine störenden Blockartefakte sichtbar werden. Als Entropiekodierung kommt die „Binäre Arithmetische Kodierung“ zum Einsatz. Zusätzlich zur verlustbehafteten, bietet JPEG2000 auch verlustlose Kompression. In einer eigenen Lerneinheit werden andere gebräuchliche Bildformate beschrieben: PNG280 und Gif117 für Grafiken, weiters das tiff 518und das bmp96 Format. VideokompressionUnkomprimierte Videodaten weisen in zwei Dimensionen Redundanzen auf: In der zeitlichen und in der örtlichen Dimension. MPEG und ITU Videostandards beseitigen örtliche Redundanzen ähnlich dem JPEG Standard. Man spricht hier von Intra-Kodierung. Zeitliche Redundanzen werden durch die Inter-Kodierung entfernt: Die grundlegende Technik dafür ist die Bewegungsschätzung und die Bewegungskompensation. MPEG-1 ist der simpelste Videostandard. MPEG-2 ist der Standard für digitales Fernsehen und für die digitaler Archivierung komprimierter Videos in hoher Qualität (z.B. Video für DVD311). Auf Grund der hohen Anzahl an Anwendungsmöglichkeiten wird der MPEG-2 Standard in „Levels und Profiles“ unterteilt. Ein weiterer wichtiger Teil des MPEG-2 Standards ist die „Interlaced Kodierung“. MPEG-4 schließlich ist nicht nur eine Erweiterung des MPEG-2 Standards mit zusätzlichen Features wie Kodierungstools für besonders geringe Datenraten, sondern führt zusätzliche, objektbasierte Kodierungstechniken ein. Der ITU316 Standard beschreibt Kodierungsverfahren für Videokonferenzen: Es werden hier die beiden ITU316-Videoencoder H.261 und H.263 erklärt, weiters der H.314 Standard – Bildtelefonie via konventionellen Telefonleitungen mittels stand-alone Geräten – vorgestellt (siehe Lerneinheit Standards für Videokonferenzen). Begriffe1CodierungJedem Zeichen eines Zeichensatzes wird ein Zeichen eines anderen Zeichensatzes zugeordnet. Kompressionsrate
Encoder/Decoder
2CodierungDie Codierung von Information ist die Grundvorrausetzung dafür, die Information elektronisch zu speichern, verarbeiten und übermitteln zu können. rech2002, 68 Nachricht, Zeichen und Zeichensatz in der CodierungEine zusammenhängende Menge von Daten heißt Nachricht. Jede Nachricht besteht aus Zeichen eines bestimmten Zeichensatzes (=Menge der verfügbaren Zeichen). Bei der Codierung wird jedem Zeichen eines Zeichensatzes ein Zeichen eines anderen Zeichensatzes zugeordnet. henn2001,33 Binäre Codierung von BuchstabenWenn ich die Buchstaben A bis Z (=Quellzeichensatz) binär codieren will, so wird jedem Buchstaben (=Quellzeichen) eine Folge von 0en und 1en (=Zielzeichen) zugewiesen. Die Menge der binären Zahlen der Tabelle ist der Zielzeichensatz. Genauso gut könnte man die Buchstaben auch dezimal codieren.
KompressionsrateAUTODie Effizienz eines Verfahrens wird durch die Kompressionsrate bestimmt. Sie gibt den Grad der Kompression wieder und wird durch das Verhältnis von Volumen der Ausgangsdaten zu komprimierten Daten definiert. Die Kompressionsrate ist der Faktor, um den die Datenmenge durch die Kompression verringert wurde. Komprimierung im Verhältnis 4:14:1 bedeutet beispielsweise eine Komprimierung auf ein Viertel der ursprünglichen Datenmenge. AUTOEs gibt kein einheitliches Kompressionsmaß. Demnach bedeutet Kompression auf 25%, Kompression um 75% oder Kompressionsfaktor 4 das Gleiche. Encoder/DecoderKompression wird oft verwendet, um die Datenmenge, die über ein Netzwerk transportiert werden muss, zu reduzieren. Deshalb wird in Zusammenhang mit Kompressionsverfahren oft von Sender und Empfänger gesprochen. SenderDabei meint man mit Sender denjenigen, der die Daten komprimiert. Durch das Anwenden eines speziellen Algorithmus wird also die Datenmenge reduziert. Diese Operation wird vom Encoder durchgeführt. Empfänger hals2000, 116Auf der anderen Seite erhält der Empfänger die komprimierten Daten. Ein umkehrender Algorithmus zur Dekompression sorgt dafür, dass dem Empfänger wieder die die Ausgangsdaten (oder in manchen Fällen annähernd die Originaldaten) zur Verfügung stehen. Diese Arbeit wird vom Decoder erledigt. Lokale ArchivierungNicht immer gibt es bei der Kompression Sender und Empfänger: z. B. wenn Daten lokal archiviert werden. Die Übertragung über das Netzwerk wird aber oft als Modell herangezogen, um ein bestimmtes Verfahren zu erklären. Speichert man eine komprimierte Nachricht am eigenen PC, so kann man dies auch als Spezialfall des obigen Modells sehen, in dem Sender und Empfänger ident sind. Klassifikation von Komprimierungsverfahren1Zwei KlassifizierungsmöglichkeitenKlassifikation nach Verlustbehaftung
Klassifikation nach Art der Codierung
2Zwei KlassifizierungsmöglichkeitenUm die Komprimierungsverfahren klassifizieren zu können, trifft man folgende Unterscheidungen: Klassifikation nach VerlustbehaftungKomprimierungsverfahren sind:
Klassifikation nach Art der CodierungBei der Art der Codierung unterschiedet man zwischen:
Verlustfreie/-behaftete Codierung1Verlustfreie Codierung
Verlustbehaftete Codierung
2Verlustfreie Codierung hals2000, 117Das Ziel der verlustfreien Kompression ist es, die Datenmenge so zu reduzieren, dass nach Anwenden eines entsprechenden Algorithmus zur Dekomprimierung die gesamte Information erhalten bleibt. Vorübergehend wird von den ursprünglichen Daten ein Abbild erzeugt, das zwar nicht ident ist, aber dieselbe Information trägt. Diese Kompressionsverfahren sind reversibel, können also ohne Informationsverlust rückgängig gemacht werden. Ein solches Verfahren muss z.B. zur Kompression einer Textdatei verwendet werden, denn hier ist wichtig, dass der Inhalt nicht verfälscht wird. Verlustbehaftete Codierung hals2000, 117Im Gegensatz dazu erzeugen verlustbehaftete Verfahren kein genaues Abbild der Daten, sondern eine Version die vom Empfänger als echte Kopie erachtet wird. Dabei treten mehr oder weniger unbedeutende Informationsverluste auf. Die Kompressionsrate ist höher, je weiter die Version vom Original entfernt ist. Als Anwendungsgebiet eignen sich besonders Bilder, Videos und Audiodaten. Das Auge beziehungsweise das Ohr kann hier kleine Abweichungen nicht wahrnehmen oder die Abweichungen werden nicht als störend empfunden. Verlustfreie vs. verlustbehaftete KompressionEs mag vorteilhaft erscheinen, unabhängig vom Medientyp verlustfreie Kompression zu verwenden. Da aber die verlustbehafteten Verfahren weit höhere Kompressionsrate erreichen, ist ihr Einsatz z.B. für digitales Video unerlässlich. Entropie-/Quellenkodierung1Entropiecodierung
Quellencodierung
Hybridcodierung
2EntropiecodierungDer Begriff der Entropie kommt aus der Informationstheorie. Die Entropie bezeichnet den mittleren Informationsgehalt einer Quelle (Nachricht). Der Informationsgehalt eines Zeichens hängt von der Auftrittswahrscheinlichkeit ab und ist umso größer, je kleiner die Auftrittwahrscheinlichkeit ist. rech2002, 195 Die Entropiecodierung ist verlustfrei und auf alle Informationstypen gleichermaßen anwendbar. Die Bedeutung der digitalen Werte ist hier irrelevant. Sie nutzt statistische Eigenschaften (z.B. Häufigkeit eines Zeichens) für eine effiziente Repräsentation der Information aus. Trotzdem die Darstellung der Information anders zu den Ausgangsdaten ist, können diese vollständig rekonstruiert werden. hals2000, 118 gibb1998, 117 QuellencodierungDie Quellencodierung oder auch Source Coding genannt, nützt die Semantik des Eingabedatenstroms. In den meisten Fällen sind solche Verfahren verlustbehaftet. Die zu codierenden Daten haben eine enge Beziehung zum Endergebnis, sind diesem aber meistens nur ähnlich und stellen nicht die gleiche Information dar. Je nach Medientyp können bestimmte Informationen weggelassen werden, ohne dabei subjektiv eine Qualitätsverschlechterung zu bemerken. HybridcodierungUnter Hybridcodierung versteht man ein zusammengesetztes Verfahren, welches die Vorteile beider Codierungen verbindet. Meist wird dies in zwei Stufen realisiert:
|
(empty) |