Current Page: | Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: m04 » Learning Units » Unit ID: 04_19 |
---|---|
Last Modified: | Tuesday, 2015-05-05 - 08:09:08 |
Tools: | Validate — Preview XML Preview HTML Preview PDF |
Alternative: | Printable HTML |
Title: | JPEG Bildvorbereitung | ||
---|---|---|---|
Abstract: | In dieser Lerneinheit werden Vorbereitungsschritte beschrieben, die notwendig sind, um ein Bild als JPEG codieren zu können: Blockzerlegung, Farbraumtransformation, Diskrete Kosuinustransformation. Weiters wird der Begriff "Frequenz" in Zusammenhang mit Bildcodierung erläutert. | ||
Status: | Captions missing | Version: | 2005-01-07 |
History: |
2005-01-07 (Robert Fuchs): Added VisJPEG applet => please test, .jar might not work properly. 2004-11-04 (Thomas Migl): Acro added 2004-10-14 Tthomas migl): PDA Abb. hinzugefügt 2004-09-22 (Thomas migl): Visio Icon als Platzhalter hinzugefügt 2004-09-17 (Thomas Migl): Statuseintrag hinzugefügt 2004-08-16 (Robert Fuchs): Checked, fixed and exported for Review #2. 2004-07-29 (Thomas Migl): Platzhalter für Applet +++ Almost final (although block-typing could be better) +++ TO DO: impl. Applet Abb PDA +++ VERW: APPLET; 41801 2004-07-29 (Robert Fuchs): Import is now complete. 2004-07-26 (Robert Fuchs): Manual import into the Greybox. 2004-03-12 (Robert Fuchs): Closed for 50% Content Deadline import in Scholion. 2004-03-11 (Thomas Migl): LOD1 Headers added 2004-03-08 (Robert Fuchs): Zapped Gremlins. 2004-03-07 (Robert Fuchs): Removed empty paragraphs from LOD1, fixed clustering bugs im LOD1 and LOD2. 2004-03-05 (Thomas Migl): LOD1, abstract 2004-03-05 (Robert Fuchs): Added images, formulas and links. 2004-03-02 (Robert Fuchs): Imported and tagged content from "m4-LU19-JPEGBilldvorbereitung-fertig.doc". 2004-02-25 (HTMLContentTools):Created skeleton page. |
Author 1: | Thomas Migl | E-Mail: | migl@ims.tuwien.ac.at |
---|---|---|---|
Author 2: | (empty) | E-Mail: | (empty) |
Author 3: | (empty) | E-Mail: | (empty) |
Author 4: | (empty) | E-Mail: | (empty) |
Author 5: | (empty) | E-Mail: | (empty) |
Organization: | Technische Universität Wien; Institut für Softwaretechnik und Interaktive Systeme; Arbeitsgruppe für Interaktive Multimediale Systeme; http://www.ims.tuwien.ac.at/ |
Einleitung1Die drei Schritte der Bildvorbereitung
2AUTODie einfachste Form, eine Bilddatei zu verkleinern, ist, das Bild in einer kleineren Auflösung zu kodieren. Diese Datenreduktion ist für unser Auge aber sofort sichtbar. Das Bild wird als weniger scharf empfunden. Allerdings zeigt die Erfahrung, dass unser Auge bei Bildern mit reinen Grauwerten eine Bildverschlechterung resultierend aus einer Verringerung der Auflösung viel genauer wahrnimmt als bei Bildern mit reinen Farbwerten. Daraus folgt schon die erste Technik zur Bildkompression, die Farbraumtransformation. Viel wichtiger aber zu einer effektiven Kompression ist die Diskrete Kosinus Transformation. Die drei Schritte der Bildvorbereitung
Blockzerlegung1AUTO
JPEG
2AUTO stru2002, 163Bildsignale haben einen instationären Charakter. Ein und dasselbe Bild kann an verschiedenen Bildstellen unterschiedliche Strukturen zeigen. So gibt es Bilderstellen, in denen großflächige, homogene Farbflächen abgebildet werden (zum Beispiel blauer Himmel), an anderen Stellen wiederum sind scharfe Kanten, feine Strukturen etc sichtbar (Gräser in einer Wiese etc). Zur effektiven Analyse eines Bildes ist es daher wichtig, die einzelnen Regionen eines Bildes getrennt voneinander zu untersuchen. Segmentierung im JPEG StandardIm JPEG-Standard wird das Bild in 8x8-Pixel Blöcke unterteilt. Die nachfolgenden Operationen werden separat auf jeden Block (Luminanz und Chrominanz voneinander getrennt) angewendet. Farbraumtransformation effe20001AUTO
Mögliche Abtastverhältnisse
Applet: JPEG Visualisierung/ Farbraumsiehe Applet Visualisierung, Reiter Farbraum 2AUTOBei der Komprimierung von Farbbildern werden bei JPEG die perzeptuellen Eigenschaften des menschlichen Auges berücksichtigt. Unser Auge kann unterschiedliche Helligkeitswerte genauer differenzieren als unterschiedliche Farben. Daher transformiert man die sonst übliche Blau-Grün-Rot-Farbdarstellung in einen Farbraum, der den Farbwert eines Pixels als Helligkeitswert (Y = Yield oder Luminanz) und Chrominanz (zwei Werte) beschreibt. In einem nach Yield und Chrominanz aufgespaltenen Farbraum können die Helligkeits- und Farbinformationen mit unterschiedlicher Dichte angegeben werden (=Unterabtastung/Subsampling). Diese Unterabtastung ist allerdings eine verlustbehaftete Prozedur. Das Comite Consultant International des Radio Communications (CCIR-601) schlagen als Nomenklatur für das Subsampling die A:B:C Notation vor. FarbunterabtastungFolgende Tabelle zeigt mögliche Abtastverhältnisse für die Farbunterabtastung.
Applet: JPEG Visualisierung/Farbraumsiehe Applet Visualisierung, Reiter Farbraum Diskrete Cosinus Transformation (DCT)1Diskrete Kosinustransformation (DCT)Inverse Diskrete Kosinustranformation (IDCT)Für beide gilt:wenn wenn wenn wenn 2AUTODie JPEG Kompression basiert auf dem Prinzip der Transformations-Kodierung. Es kommt dabei die Diskrete Cosinus Transformation (DCT) zum Einsatz (siehe auch Fouriertransformation). Der Grund für den Einsatz einer Transformation besteht darin, dass man das Bildsignal in einer geeigneten Form repräsentieren will, die es ermöglicht, für unser Auge kaum wahrnehmbare und daher redundante Bildinformationen getrennt von deutlich sichtbaren und daher wichtigen Bildinformationen darzustellen. Die DCT ist reversibel, dabei ist die inverse DCT jene Operation, die wieder auf die ursprüngliche Bilddarstellung zurückführt. Beide Transformationen, DCT und inverse DCT, sind verlustlos, bewirken daher auch noch keine Datenkomprimierung. Sie ermöglichen jeglich zwei verschiedene Darstellungsformen ein und desselben Bildsignals. Die DCT führt von der Darstellung im räumlichen Bereich zu der im spektralen Bereich (Frequenzbereich), die inverse DCT vom spektralen zurück in den räumlichen Bereich. Diskrete Kosinustransformation (DCT) furt1995, 105Wobei gilt: wenn wenn wenn wenn Inverse Diskrete Kosinustransformation (IDCT) furt1995, 111Bei JPEG werden die aus der Blockzerlegung resultierenden 8x8-Pixel Blöcke eines Bildes in den beiden Bereichen betrachtet Applet JPEG Visualisierung/DCTsiehe JPEG Visualisierung, Reiter DCT Darstellung räumlicher/spektraler Bereich1Räumliche Darstellung eines 8x8 Pixel Blockes
Spektrale Darstellung eines 8x8 Pixel Blockes
2AUTODie Werte eines 8x8 Pixelblockes werden im Folgenden sowohl in der räumlichen wie auch spektralen Darstellung in einer 8x8 Matrix dargestellt. Je nach gewählter Darstellungsform haben die Werte dieser Matrix unterschiedliche Bedeutung. Darstellung im räumlichen BereichJeder der 64 Werte eines 8x8 Pixel Blockes gibt im Y-Bild den dem Ort entsprechenden Helligkeitswert an, in den beiden Chrominanzbildern die dem Ort entsprechenden Farbwerte. Y-BildDer Koeffizient in der Matrix an der Stelle 1.Reihe, 1. Spalte ist der Helligkeitswert des links oberen Pixels des 8x8 Blockes. Insert image here; book is with Roman & Doris Darstellung im spektralen BereichIm spektralen Bereich besteht kein Zusammenhang mehr zwischen der Position eines Koeffizienten innerhalb der Matrix und der Örtlichkeit eines Pixels. Vielmehr beschreibt die Position des DCT Koeffizienten jene Frequenzen, die er repräsentiert. Was bedeutet Frequenz für ein Bild?1Bereiche verschiedener Frequenzanteile PC
Bereiche verschiedener Frequenzanteile PDA_Phone
2AUTOMomentan kann es verwirrend sein, dass ein Bild beziehungsweise ein Ausschnitt davon mit dem Begriff "Frequenz" beschrieben wird. Mit der allgemeinüblichen Definition für Frequenz: "Frequenz ist die Anzahl an Schwingungen, die ein Pendel innerhalb einer Sekunde absolviert" wird man sich dem, was die Frequenz in einem Bild beschreibt, nur sehr schwer nähern können. AUTOFür ein Bild ist die Frequenz nicht das Maß für eine Schwingungsdauer, sondern ein Maß für die örtliche Änderung der Pixelwerte. Sind in einem Bildteil hohe Werteänderungen benachbarter Pixel vorhanden, hat dieser Bildbereich hohe Frequenzkomponenten. Sind die Wertdifferenzen der benachbarten Pixel gering oder gleich Null, hat das Bild in diesem Bereich mäßig hohe bzw gar keine Frequenzkomponenten. Bereiche verschiedener Frequenzanteile
Bereiche verschiedener Frequenzanteile PDA_Phone
Bildbereiche ohne FrequenzanteileMan betrachte die Grauwerte nebeneinander liegender Pixel im Bereich 3 des Bildes. Dieser Bereich ist eine homogene Graufläche. Alle in diesem Bereich befindlichen Pixel haben den gleichen Grauwert. Es gibt keine Änderung der Werte. Es sind in diesem Teil des Bildes keine Frequenzkomponenten enthalten. Bildbereiche mit FrequenzanteilenHier sind die Grauwerte des betrachteten Bildausschnittes unterschiedlich. Die Grauwerte benachbarter Pixel sind unterschiedlich. Mäßige FrequenzanteileMan betrachte das Portrait von Lena im Bildbereich 2. Am Hut von Lena sind zwar unterschiedliche Herlligkeitswerte der Pixel, verursacht durch die Oberflächenstrukur des Hutes und durch den Einfallswinkel des Lichtes, der Helligkeitsverlauf ist aber relativ kontinuierlich. Dieser Bereich wird nur mäßig große Frequenzkomponenten aufweisen. Hohe FrequenzanteileBereich 1: Sehr hohe Frequenzen beinhalten jene Bildteile, wo benachbarte Pixel sehr unterschiedliche Grauwerte haben. im Bild von Lena ist dies die weiße Hutkrempe vor schwarzem Hintergrund. Jene Bildbereiche, die die Kante des Krempe beinhalten, werden genau an der Schnittstelle benachbarte Pixel haben, deren Werte weiß beziehungsweise schwarz sind. Hier ist eine maximale Änderung der Grauwerte benachbarter Pixel. Diese Bildteile beinhaltet sehr hohe Frequenzkomponenten. Die DCT Koeffizienten1DCT KoeffizientenDC-Koeffizient
AC- Koeffizienten
DCT Koefizienten eines 8x8 Pixel Blockes
DCT Koeffizientenposition mit den repräsentierten FrequenzenAUTO PCAUTO PDA_Phone2DCT KoeffizientenDie in der 8x8 Matrix dargestellten Werte geben die DCT Koeffizienten für den 8x8 Pixel Block an. Man unterscheidet zwischen zwei Arten von Koeffizienten, den DC 494 und den AC 507 Koeffizienten. Die Unterscheidung der beiden Typen ist für den gesamten Kompressionsverlauf wichtig, da sie dabei völlig unterschiedliche Prozeduren durchlaufen und auch unterschiedlich kodiert werden (siehe Lerneinheit JPEG Kodierungstechnik). DC KoeffizientenDer Koeffizient, der in der linken oberen Ecke der 8x8 Matrix steht, wird als der DC Koeffizient bezeichnet. DC steht für "Direct Current", dies ist wiederum ein Begriff aus der Elektrotechnik und bedeutet Gleichstrom. Für die Bildkompression heißt es, dass dieser DC Koeffizient den Signalanteil mit der Frequenz gleich Null beschreibt, also keine Wechselanteile beinhaltet. Für einen 8x8 Pixel Block eines Bildes gibt der DC Koeffizient den Mittelwert aller 64 Pixel an. Für das Y-Bild ist das der mittlere Grauwert, für die Chrominanzbilder der über den Block gemittelte Farbwert. Dummy insert image here; book is with Roman & Doris AC-KoffizientenDie restlichen Koeffizienten der Matrix sind die AC Koeffizienten. AC steht für "alternating current". Diese Koeffizienten repräsentieren die Frequenzkomponenten des betrachteten Bildteils. Für die Positionierung eines AC-Koeffizienten gilt, je höher die zugehörige Frequenz, desto weiter rechts bzw. weiter unten wird er in der 8x8 Matrix notiert. Die Spaltenzahl bezieht sich auf horizontalen, die Zeilenzahl auf die vertikale Werteänderungen der Pixel. .Wobei hier wieder gilt: sehr hohe Frequenz repräsentieren einen sehr raschen Werteunterschied benachbarter Pixel, niedrigere Frequenzen eher einen kontinuierlichen Werteänderungsverlauf. DCT Koefizienten eines 8x8 Pixel Blockes
Bildliche Veranschaulichung der DCT KoeffizientenAUTO PCAUTO PDA_PhoneAUTODie Abbildung soll veranschaulichen, welche Koeffizienten welche Helligkeitsverläufe in einem 8x8 Pixel Block repräsentieren. Dabei gilt, je größer der entsprechende Koeffizient, desto signifikanter sind die von ihm repräsentierten Frequenzen. Die Gesamtstruktur des 8x8 Blockes ergibt sich aus der Summe aller Frequenzen. Applet: JPEG Visualisierung1Applet: JPEG Visualisierung2Applet: JPEG VisualisierungEinleitungDas folgende Java Applet soll im experimentellen Umgang helfen, Prozeduren, die die JPEG Kodierung durchläuft, kennen- und verstehen zu lernen. Es beschreibt unteranderem die in dieser Lerneinheit erläuterten Techniken der Farbraumtransformation und der DCT Transformation. AppletbeschreibungDie Oberfläche des Applets ist in zwei Bereiche geteilt. Bereich mit ReiterauswahlDer rechte Bereich ist in 6 Reiter aufgeteilt. Jeder Reiter beschreibt eine Prozedur von JPEG . Die Anordnung der Reiter (von links beginnend) entspricht der streng festgelegten Reihenfolge der JPEG Kodierung. Bereich für BildauswahlDer linke Bereich des Applets bleibt unabhängig vom gewählten Reiter gleich. Hier kann die Studentin ein Bild auswählen, welches im oberen Bildfenster angezeigt wird. Verändert nun die Studentin in einer der Prozeduren bestimmte Parameter, kann sie in der linken Spalte den Button „Neu berechnen“ wählen. Im unteren Bildfenster wird dann das entsprechende JPEG Bild angezeigt (wobei sie auch „Differenzbild“ wählen kann, welches Aufschluss über die Qualität der Kodierung gibt). Weiters wird auch der entsprechende Kompressionsgrad berechnet und in einem Fortschrittsbalken angezeigt. Reiter für Farbraum und DCTFarbraumStudentin kann Grad der Unterabtastung (=Subsampling) wählen, ein Fortschrittsbalken zeigt die durch diesen Schritt erreichte Datenreduktion. DCTDie Studentin kann mit Maus einen 8x8 Pixelblock im Bild wählen. Es werden die Pixelwerte und die DCT Koeffizienten sowohl in Tabellen- wie auch in 3D Ansicht dargestellt. |
(empty) |