Current Page: Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: m04 » Learning Units » Unit ID: 05_32
Last Modified:Tuesday, 2015-05-05 - 08:09:06
 
Tools: ValidatePreview XML Preview HTML Preview PDF
Alternative: Printable HTML

 

Learning Unit ID: 05_32
Title: MPEG-2 Levels und Profiles
Abstract: Der MPEG-2 Standard deckt ein derartig großes Feld an Anwendungen ab, daß es keinen Sinn macht, für jede Anwendung den Geräten (Kodierer, Decoder) Konformität mit dem gesamten MPEG-2 Standard abzuverlangen. Daher unterteilt man den Standard in Untergruppen. Diese Untergruppen werden durch Profiles and Levels beschrieben.
 
Status: Final for Review #2 - Version: 2004-10-14
History: 2004-10-14 (thomas migl): pda abb hinzugefügt
2004-09-23 (Thomas migl): abb. explanation auszeichnung korrigiert
2004-08-30 (Robert Fuchs): Checked, fixed and exported for Review #2.
2004-08-26 (Thomas Migl): importiert, quasi finalisiert
2004-03-12 (Robert Fuchs): Closed for 50% Content Deadline import in Scholion.
2004-03-09 (Thomas Migl): abstract added
2004-03-05 (Robert Fuchs): Fixed sources (LOD => CorPU where nececssary) and added links.
2004-02-27 (HTMLContentTools): Replaced old numeric source refs by new alphanumeric ones.
2004-02-26 (Robert Fuchs) - Upgrade from old LU 530, version 2003-12-03.
2004-02-25 (HTMLContentTools) - Created skeleton page.
2003-12-03 (Robert Fuchs): Import von Version 2003-08-23 aus HTML Authoring Systeme v.1

Author
Author 1: Thomas Migl E-Mail: migl@ims.tuwien.ac.at
Author 2: (empty) E-Mail: (empty)
Author 3: (empty) E-Mail: (empty)
Author 4: (empty) E-Mail: (empty)
Author 5: (empty) E-Mail: (empty)
Organization: Technische Universität Wien; Institut für Softwaretechnik und Interaktive Systeme; Arbeitsgruppe für Interaktive Multimediale Systeme; http://www.ims.tuwien.ac.at/

Content

Einleitung

1

auto watk2001-1, 20

  • MPEG-2 beschreibt großes Anwendungsgebiet
  • Aufteilung des Standards in Untergruppen
    • Profiles
      • Maß für Komplexität
    • Levels
      • Bildgröße und -auflösung

2

auto watk2001-1, 20

MPEG-2 Standard deckt ein derartig großes Feld an Anwendungen ab, daß es keinen Sinn macht, für jede Anwendung den Geräten (Kodierer, Decoder) Konformität mit dem gesamten MPEG-2 Standard abzuverlangen. Daher unterteilt man den Standard in Untergruppen. In jeder Untergruppe werden die Mindestanforderungen an die in die Anwendung involvierten Geräte definiert. Darin wird die Art der Farbunterabtastung, die maximale Bildgröße und die maximale Bild- und Datenrate vorgegeben. Die Untergruppen werden durch Profiles and Levels beschrieben.

Der Level bezieht sich auf die Bildgröße und die Bildauflösung, das Profile gibt Aufschluss über den Grad der Komplexität.

Übersicht Profiles und Levels watk2001-1,20

1

Tabelle für MPEG-2/Profiles und Levels

Levels/Profiles Simple Main 4:2:2 SNR Spatial High
High   4:2:0
1920x1152
90Mb/s
60 frame/s
      4:2:0 or
4:2:2
1920x1152
100Mb/s
High 1440   4:2:0
1440x1152
60Mb/s
60 frame/s
    4:2:0
1440x1152
60Mb/s
60 frame/s
4:2:0 or
4:2:2
1440x1152
80Mb/s
Main 4:2:0
720x576
15Mb/s
keine B
4:2:0
720x576
15Mb/s
30 frame/s
4:2:2
720x 576
50Mb/s
4:2:0
720x576
15Mb/s
  4:2:0 or
4:2:2
720x576
20Mb/s
Low   4:2:0
352x288
4Mb/s
30 frame/s
  4:2:0
352x288
4Mb/s
   

2

Tabelle für MPEG-2/Profiles und Levels

Levels/Profiles Simple Main 4:2:2 SNR Spatial High
High   4:2:0
1920x1152
90Mb/s
60 frame/s
      4:2:0 or
4:2:2
1920x1152
100Mb/s
High 1440   4:2:0
1440x1152
60Mb/s
60 frame/s
    4:2:0
1440x1152
60Mb/s
60 frame/s
4:2:0 or
4:2:2
1440x1152
80Mb/s
Main 4:2:0
720x576
15Mb/s
keine B
4:2:0
720x576
15Mb/s
30 frame/s
4:2:2
720x 576
50Mb/s
4:2:0
720x576
15Mb/s
  4:2:0 or
4:2:2
720x576
20Mb/s
Low   4:2:0
352x288
4Mb/s
30 frame/s
  4:2:0
352x288
4Mb/s
   

Erläuterung zur Tabelle für MPEG-2/Profiles und Levels

Die in der Tabelle angegebenen Werte beschreiben immer die Mindestanforderungen, um einer Untergruppe zu entsprechen. Für die Bildauflösung leiten sich die Werte vom PAL Standard ab, da dieser eine größere Bildauflösung (720x576) als der nordamerikanische NTSC Standard (640x480) verlangt. Für die Bildwiederholungsfrequenz wird der Wert des NTSC verwendet (knappe 30 Bilder/s gegenüber 25 Bilder/s bei PAL.

Erklärung der Tabelle für MPEG-2/Profiles und Levels

Levels
  • Low Level - Geringe Auflösung, gegenüber klassischem Fernsehformat wird nur jede zweite Zeile dargestellt. Jede Zeile wird in 288 Pixel zerlegt
  • Main Level - Bildauflösung entspricht der klassischen Bilddarstellung im Fernsehen
  • High 1440 - doppelt so hohe Bildauflösung und Bildwiederholungsfrequenz wie im Main Level
  • High - hohe Auflösung im 16:9 Bildformat, Bildwiederholungsfrequenz wie im High 1440 Level
Profiles
  • Simple Profile - unterstützt keine B- Frames. Es sind nur I und P Frames erlaubt. Diese Beschränkung reduziert die Kodierungsrechenzeit beträchtlich. Es ist für Anwendungen gedacht, die zeitkritisch bezüglich Kodierung sind, aber auch mit einfach aufgebauter Hardware funktionieren sollen. Es ist nur im Main Level unter der Bezeichnung SP ML definiert.
  • Main Profile - ist das am meist genutzte innerhalb des MPEG-2 Standards. Die Mehrheit der Anwendungen für digitales Fernsehen arbeiten in diesem Profile.
  • 4:2:2 Profile - In diesem Profile werden dementsprechend mehr Farbwerte zur Kodierung herangezogen. Dementsprechend höher ist auch die erforderliche Mindestdatenrate. Dieses Profile wurde speziell erarbeitet, um auch in bereits vorhandenen digitalen Fernsehumgebungen mit der Farbunterabtastung 4:2:2 arbeiten zu können
  • SNR und Spatial - bieten zusätzlich die Möglichkeit der skalierbaren Kodierung.
  • High Profile - In diesem Profile wird wahlweise mit 4:2:0 oder4:2:2 Farbunterabtastung gearbeitet. Es ist mit Ausnahme für Level Low für alle Levels definiert. Im Vergleich zum Main Profile sind die Datenraten höher gewählt

Profiles für Skalierbare Kodierung siko1997

1

Motivation für skalierbare Kodierung

Einziger Datenstrom soll Geräte verschiedener Komplexität bedienen können

Prinzip der skalierbaren Kodierung

  • Datenstrom in verschiedene Schichten aufgebaut
  • unterste Schicht - Videosignal in einfachster Form
  • weitere Schichten - Zusatzdaten für Signal mit höherer Qualität

Anwendungen für skalierbare Kodierung

  • Digitales Fernsehen
  • Anpassung an Übertragungsbedingungen
  • Multimedia Umgebungen

2

Motivation für skalierbare Kodierung

MPEG-2 ist in Bezug auf erforderlicher Hardware sehr weitflächig angelegt. Es können sowohl einfach aufgebaute, nur mit einem kleinen Bildschirm ausgestatteten Geräte als auch solche mit einem hochauflösenden Bildschirm bedient werden. Ein für das komplexere Gerät optimierter Stream würde das einfache Gerät aber auf Grund der hohen Datenraten überfordern, ein für das kleine Gerät optimierter wird dem großen eine nur unzureichende Qualität liefern.

Prinzip der skalierbaren Kodierung

Bei der skalierbaren Kodierung erzeugt man einen Datenstrom, innerhalb welchen das Signal in verschiedenen Schichten dargestellt wird. In der untersten Schicht (engl. Layer) ist das Signal in seiner einfachsten Qualität enthalten. In einer zweiten Schicht werden dann zusätzlich Daten geliefert, mit deren Hilfe ein Decoder aufbauend auf Schicht 1 das Signal besserer Qualität rekonstruieren kann. Ein weitere Schicht kann wiederum auf Schicht 2 aufbauend einen weiteren Qualitätslevel erzeugen. Die Anzahl der Schichten des Datenstroms ist gleich der Anzahl der darin enthaltenen Qualitätslevels des Videosignals.

Anwendungen für skalierbare Kodierung

Digitales Fernsehen

Skalierbare Kodierung spielt eine große Rolle im Miteinander von HDTV (High Density Television) and SDTV (Standard Definition Television). Eine Einführung des HDTV kann nur dann erfolgreich sein, wenn eine Umgebung geschaffen wird, in der beide Systeme parallel und zueinander kompatibel arbeiten können. Um beide Systeme gleichzeitig bedienen zu können, müßte eine Fernsehsenderanstalt pro Programm jeweils zwei Streams aussenden, daß einen dementsprechenden Datenraten-Overhead zu Folge hätte. Mit Hilfe der skalierbaren Kodierung können beide Fernsehsysteme mit ein und dem selben Signal beliefert werden.

Anpassung an Übertragungbedingungen

Das Signal wird so kodiert, dass es sowohl unter optimalen wie auch unter nicht optimalen Bedingungen übertragen werden kann. Möchte man das Signal beispielsweise terrestrisch übertragen, muss man mit Störungen, verursacht durch Witterung, Reflexionen usw., rechnen. Der Datenstrom beinhaltet daher einerseits das Signal in voller Qualität (das man dann auch bei günstiger Wetterlage empfangen kann) andererseits das gleiche Signal in verminderter Qualität,das aber eine hohe Robustheit gegenüber Störungen aufweist.

Multimedia Umgebung

Weiteres Einsatzgebiete der skalierbaren Kodierung sind das Browsen in Videodatenbanken und die Wiedergabe von Videos in verschiedener Auflösung in Multimedia Umgebungen.

Die drei Standards der skalierbaren Kodierung siko1997

1

  • Örtliche Skalierung - verschiedene Bildauflösungen
  • Zeitliche Skalierung - verschiedene Bildwiederholungsfrequenzen
  • SNR Skalierung - verschiedene Bild Qualitäten
    • mindere Qualität - robust gegenüber Störungen
    • hohe Qualität - sensibel gegenüber Störungen

2

Während der Entwicklung des MPEG-2 Standards mußte man zur Kenntnis nehmen, daß es unmöglich ist, ein einziges System für die skalierbare Kodierung zu entwickeln, dass für alle Anwendungen gleich gut geeignet ist. Als Konsequenz dieser Einsicht definierte man drei unterschiedliche Standards zur skalierbaren Kodierung.

Örtliche Skalierung stru2002, 198

Content

Diese Kodierung kommt dort zur Anwendung, wo Geräte mit unterschiedlicher Bildschirmauflösung mit ein und dem selben Datenstrom beliefert werden sollen. Da in der Regel benachbarte Bildpunkte sehr ähnlich sind, werden auch im Allgemeinen die Prädiktionsfehler klein sein. Daher wird ein in solcher Art kodierter Datenstrom im Vergleich zu einem, in welchem das SDTV- und HDTV-Signal von einander getrennt kodiert ist, eine viel kleinere Bandbreite benötigen. Örtliche Sklaierung kann natürlich beliebig viele Schichten beinhalten.

Schichtaufbau des MPEG-2 Datenstroms für örtliche Skalierung

Zum Aufbau der verschiedenen Schichten wird das Originalvideo in seiner besten Qualität örtlich unterabgetastet. Beispiel ist der parallele Betrieb von HDTV und SDTV. In der unteren Schicht des Datenstroms wird das Videosignal in der Bildauflösung für SDTV (720x576) dargestellt. In der zweiten Schicht sollen jetzt Daten enthalten sein, um das Video auch in HDTV Qualität (1440x1152) empfangen zu können. Zur Erzeugung dieser Schicht werden die zusätzlichen Bildpunkte für HDTV ausgehend von den Werten der unmittelbar benachbarten Bildpunkte der Schicht 1 prädiziert. Diese errechneten Werte werden dann mit den tatsächlichen Werten verglichen, die Differenzen, die sogenannten Prädiktionsfehler, in Schicht 2 gespeichert

Zeitliche Skalierung

Diese Kodierung kommt dort zur Anwendung, wo Geräte mit unterschiedlicher Bildfolgefrequenz mit ein und dem selben Datenstrom beliefert werden sollen. Mit dieser Kodierung können auch stereoskope Videosignale übertragen werden. In derBasisschicht befindet sich das Signal des ersten Blickwinkels (meist links). In der Schicht darüber wird das jeweils räumlich dazugehörige Bild mittels Prädiktionstechnik gesendet.

Schichtaufbau des MPEG-2 Datenstroms für zeitliche Skalierung

Zum Aufbau der verschiedenen Schichten wird das Originalvideo in seiner besten Qualität zeitlich unterabgetastet. In der Basisschicht wird das Originalvideo mit reduzierter Bildfolgefrequenz kodiert. Zum Aufbau der zweiten Schicht werden die Bilderlücken mit Prädiktionbilder, die sich aus den rekonstruierten Bildern der Basisschicht ergeben, besetzt. Diese Prädiktionsbilder werden dann mit den tatsächlichen Bildern verglichen, die Differenzen, die Prädiktionsfehler, werden gespeichert. Es werden nun sukzessiv so viele Schichten erzeugt, bis alle gewünschten Bildfolgefrequenzwerte im MPEG-Datenstrom enthalten sind.

SNR Skalierung

Diese Kodierung wurde entwickelt, um die Qualität eines Signals der jeweiligen Übertragungsumgebung anpassen zu können. Bei einer quasi störungsfreien Übertragung soll dem Empfänger die volle Qualität zur Verfügnung stehen. Treten zwischen Sender und Empfänger größere Störungen auf, so soll es trotzdem möglich sein, das Signal widerzugeben, wenn auch nur in verminderter Bildqualität. SNR bedeutet Signal to Noise Ratio. (Siehe SNR für Audiokodierung)

Schichtaufbau des MPEG-2 Datenstroms für SNR Skalierung

Zur Erzeugung der Schichtstruktur verlegt man die Skalierung des Signals in den DCT-Frequenzbereich. Die Bildauflösung bleibt für jeden Qualitätslevel der gleiche. In der Basisschicht befindet sich das Signal mit grob quantisierten DCT-Koeffizienten. Die Bildqualität ist in dieser Schicht zwar nur mäßig, aber weitgehend resistent gegenüber Störungen. In der darüberliegenden Schicht werden dann die Differenzen zwischen nichtquantisierten und den grob quantisierten Koeffizienten der Basisschicht mit genauerer Quantisierung übertragen. Auch hier können beliebig viel Schichten aufgebaut werden. Jene Schichten, die genauere Quantisierungsinformationen über die DCT Koeffizienten enthalten, können allerdings durch Umgebungsstörungen unbrauchbar gemacht werden.

Blockdiagramm für skalierbare Kodierung siko1997

1

Blockdiagramm für skalierbare KodierungPC

Blockdiagramm für skalierbare KodierungPDA_Phone

2

Blockdiagramm für skalierbare KodierungPC

Blockdiagramm für skalierbare KodierungPDA_Phone

Blockdiagramm für skalierbare Kodierung

Blockdiagramm zeigt das Grundprinzip der Skalierbaren Kodierung. Es werden hier zwei Schichten erzeugt. Durch Unterabtastung (zeitlich oder örtlich) wird ein Videosignal mit geringerer Bildauflösung (örtlich) oder geringerer Bildfrequenz (zeitlich) erzeugt. Dieses Signal wird in die Basisschicht des Bitstreams kodiert (hat eine dementsprechend geringere Bitrate als das Originalsignal). Durch Überabtasten der aus der Basisschicht rekonstruierten Bilder erzeugt man Prädiktionsbilder für das Video in der Originalauflösung. Der Prädiktionsfehler (Originalbild - Prädiktionsbild) wird dann in die zweite Schicht des Datenstroms kodiert.


Notes
(empty)