Audio/Video Netzwerkanforderungen
1
Hauptanforderungen
- Bit-Raten
- Übertragungsverzögerungsvariation (Jitter)
- Inter-media Synchronisation
2
Hauptanforderungen
Die Hauptanforderungen bei der Übertragung von Audio und Video betreffen
die Bit-Rate, den Jitter und die Inter-Media Synchronisation.
- Die Bitrate bezeichnet die Geschwindigkeit,
mit der Daten übertragen werden. Die Bitrate wird in bit/s bzw.
in den entsprechenden Zehnerpotenzen als kbit/s, Mbit/s, Gbit/s
angegeben. Abhängig von den Anforderungen der zu übertragenden Daten
können sie entweder mit CBR449
(konstante Bitrate), VBR450
(variable Bitrate) oder ABR451
(verfügbare Bitrate) übertragen werden. Diese drei unterschiedlichen
Möglichkeiten werden in den nächsten Abschnitten näher erläutert.
- Als Jitter bezeichnet man Störungen
im Zeitablauf eines digitalen Signals, die zu Verzerrungen führen
können.
- Die Inter-media Synchronisaton
bezieht sich auf die zeitlichen Beziehungen zwischen verschiedenen
Medienobjekten. Ein Beispiel der zeitlichen Beziehung einer Multimedia-Synchronisation
ist eine Audio-Video Sequenz, auf die eine Reihe von Bildern und
eine Animation folgt, die von einer Audio-Sequenz kommentiert wird.
Bit-Raten
1
Arten von Bitraten
Traditionelle Echtzeit-Applikationen:
- konstante Bitrate (CBR449):
zeitempfindlich
- Telefon PABXs, CBR449
Videokonferenz System, ...
Traditionelle Massendaten-Applikationen:
- verfügbare Bitrate (ABR451):
nicht zeitempfindlich
Modern/Interaktiv: Echtzeit-Applikationen:
- variable Bitrate (VBR450):
zeitempfindlich
- Audio/Video komprimiert
- Fernzugriff
Anforderung an die Bitrate für Audio
Qualität |
Technik oder Standard |
Kbit/s |
Kompr. |
Telefon Qualität |
Standard |
G.711 PCM38 |
64 |
|
Standard |
G.721 ADPCM100 |
32 |
J |
Verbessert |
G.722 SB-ADPCM100 |
48, 56, 64 |
J |
Vermindert |
G.728 LD-CELP |
16 |
J |
Vermindert |
GSM |
13 |
J |
Vermindert+ |
CELP |
5-7 |
J |
CD Qualität |
|
|
|
Konsument CD-Audio |
CD-DA |
1441(Stereo) |
|
Konsument CD-Audio |
MPEG31
mit FFT417 |
192-256 |
J |
Tonstudio Qualität |
MPEG31
mit FFT417 |
384 |
J |
Anforderungen an die Bitrate für Video
Qualität |
Technik oder Standard |
Mbit/s |
Kompr. |
Videokonf. Qualität |
H.261 |
0.21 |
J |
VCR Qualität |
MPEG31-1 |
1.2 |
J |
Broadcast Qualität |
MPEG31-2 |
2-4 (1) |
J |
Studio-Qualität digitales TV |
Unkomprimiert |
ITU-R 601 |
166 |
|
Komprimiert |
MPEG31-2 |
3 bis 6 (2) |
J |
HDTV307 |
Unkomprimiert |
CD-DA |
2000 |
|
Komprimiert |
MPEG31-2 |
25 bis 34 |
J |
Welche Bit-Rate wird gebraucht?
Welche Bit-Rate wird gebraucht?
- Die originale Bitrate von digitalisiertem Ton entspricht nicht
exakt der Netzwerk-Bitrate
- Netzwerk-Overheads inkl.:
- Echtzeit Protokol (normalerweise RTP106)
Header (12 Bytes)
- Transport Protokol (normalerweise UDP141,
8 Bytes) Header
- IP Paket Header (20 Bytes)
- Beispiel:
original G.711 64 Kb/s benötigt von 68 bis 80 Kb/s
Jedoch beinhaltet Sprache auch Pausen
Auto PC
Auto PDA_Phone
Sprechpausen
Monolog
Auto PC
Auto PDA_Phone
Auto
Telefon Konversation zwischen zwei Parteien
- 20% Pause für die gesamte Konversation
- 60% Pause für jede Partei
- Werden die Pausen unterdrückt, so senkt sich die benötigte Bitrate
im Vergleich zur Original-Bitrate um bis zu 40%
Auto PC
Auto PDA_Phone
2
Arten von Bitraten
Wie schon erwähnt, gibt es verschiedene Arten von Bitraten. Im folgenden
werden beispielhaft die CBR449
(konstante Bitrate), ABR451
(verfügbare Bitrate) und VBR450
(variable Bitrate) erklärt. Es sind drei von fünf vom ATM-Forum (http://www.atmforum.com/)
spezifizierte Service-Klassen.
- CBR449
ist für Echtzeitanwendungen gedacht, die keinerlei Toleranz gegenüber
Bandbreite und Latenz sowie Paketverlust haben, wo also eine bestimmte
Dienstgüte unbedingt gewährleistet
sein muss. Hier wird der Applikation für die gesamte Übertragungsdauer
eine konstante Bitrate zugeteilt. Die Service-Klasse CBR449
muss für zeitkritische Anwendungen verwendet werden, die eine garantierte,
kontinuierliche Übertragungsrate erfordern (beispielsweise die Echtzeitübertragung
von Sprache oder Video). Bei dieser Service-Klasse gibt es keine
Nachsendung verlorengegangener Pakete, also keine Übertragungssicherung.
Zum einen wäre dieses auch nicht sinnvoll, da mit nachgesendeten
Paketen bei Video- oder Audio-Echtzeitanwendungen nichts anzufangen
ist, zum anderen wird so der Verwaltungsaufwand beträchtlich gesenkt.
- Wie der Name ABR451
("verfügbare Bitrate") schon sagt, ändert sich die Bitrate
während der Übertragungsdauer. Die Daten werden mit der jeweils
verfügbaren Bitrate übertragen. ABR451
eignet sich speziell für Verbindungen, die keine
garantierte Übertragungsrate erfordern und demnach nicht
zeitkritisch sind, wie z.B. die Dateiübertragung und E-Mail. Diese
Service-Klasse wird von traditionellen Massendaten-Applikationen
verwendet.
- Moderne Echtzeit-Applikationen verwenden zumeist eine variable
Bitrate bei der Datenübertragung. Hier bewegt sich die Bitrate innerhalb
bestimmter Grenzen. VBR450
ist für Verbindungen geeignet, bei denen eine bestimmte Untergrenze
bei der Übertragungsrate eingehalten werden muss, die jedoch
bestimmte Schwankungen bezüglich der oberen Übertragungsrate und
somit auch zeitweilige Übertragungsspitzen zulassen. Das ATM-Forum
hat für die Datenübertragung mit variabler Bitrate zwei Servicetypen
definiert: die Übertragung in Echtzeit (VBR/rt) und die Übertragung
in Nicht-Echtzeit (VBR/nrt). Beide Servicetypen unterstützen Datenverkehr
mit variabler Bitrate. Bei der Echtzeitübertragung ist allerdings
die strikte Einhaltung der Zeitsynchronisation bei mittleren Verkehrsströmen
und bei Spitzenlast erforderlich, da diese für die Übertragung von
Sprache und Video benutzt wird. Bei der Übertragung in Nicht-Echtzeit
wird eine veränderliche, aber vorhersagbare Verzögerung toleriert.
VBR450 in
Echtzeit ist ideal für die Übertragung von komprimierter Sprache
und interaktiven multimedialen Anwendungen. Auch bei VBR/rt gibt
es wie bei CBR449
keine Übertragungssicherung. Die Nicht-Echtzeit-Version von VBR450
ist optimal für die Übertragung von kritischen Daten, da hier die
Übertragung auch gesichert ist.
Anforderung an die Bitrate für Audio
Anforderung an die Bitrate für Audio
Qualität |
Technik oder Standard |
Kbit/s |
Kompr. |
Telefon Qualität |
Standard |
G.711 PCM38 |
64 |
|
Standard |
G.721 ADPCM100 |
32 |
J |
Verbessert |
G.722 SB-ADPCM100 |
48, 56, 64 |
J |
Vermindert |
G.728 LD-CELP |
16 |
J |
Vermindert |
GSM |
13 |
J |
Vermindert+ |
CELP |
5-7 |
J |
CD Qualität |
|
|
|
Konsument CD-Audio |
CD-DA |
1441(Stereo) |
|
Konsument CD-Audio |
MPEG31
mit FFT417 |
192-256 |
J |
Tonstudio Qualität |
MPEG31
mit FFT417 |
384 |
J |
Auto
Die obige Tabelle zeigt die Anforderungen an die Bitrate für verschiedene
Audio-Applikationen.
Für Telefonverbindungen liegt die benötigte Bitrate zwischen 64 und
5 kbit/s. Unkomprimierte Standard Telefon Qualität, welche mit der
ITU-Empfehlung G.711 PCM38
(Pulscodemodulation: Verfahren der Signalformkodierung, welches analoge
Signale in digitale umwandelt) kodiert wurde, benötigt eine Bitrate
von 64 kbit/s.
Die Empfehlung der CCITT453
G.721 beschreibt ein Verfahren zur Kompression von typischen 64 kbit/s-Audiosingalen
auf 32 kbit/s. Es wird allgemein Adaptive Differential Pulsecodemodulation
(ADPCM100)
genannt.
Mit dieser Technik komprimierte Standard Telefon Qualität benötigt
wie oben erwähnt eine Bitrate von 32 kbit/s.
Daten von verbesserter Telefon Qualität, welche mit G.722 kodiert
wurden, benötigen bei der Übertragung eine Bitrate zwischen 48 und
64 kbit/s.
Unter der Bezeichnung G.722 ist das Prinzip der Teilbandkodierung
bekannt. Diese arbeitet nach dem Prinzip der Signalformkodierung und
zerlegt das Ausgangssignal in verschiedene Frequenzbereiche, die getrennt
voneinander mit differentieller Pulscodemodulation (DPCM103)
kodiert werden. Bei differentieller PCM wird eine Datenreduktion durch
die Übertragung der Differenz zwischen Vorhersagewert und dem tatsächlichen
Abtastwert erreicht.
Verminderte Telefon Qualität wird oft CELP452-kodiert
(Code-Excited Linear Prediction) übertragen. Bei CELP452
wird nicht das eigentliche Signal übertragen, sondern nur ein "Code"
mit geringerer Bandbreite. Ein Codec-Typ, der dieses Verfahren nutzt
ist G.728 mit einer Bitrate von 16 Kbit/s.
Mittels GSM (Global System for mobile Communication) übertragene Telefongespräche
benötigen eine Bitrate bei der Übertragung von 13 Kbit/s.
Die Bitrate bei der Speicherung auf CD liegt je nach Qualität zwischen
1441 und 192 Kbit/s. Eine Konsument Audio-CD (Stereo) nach dem CD-DA-Standard
(Digital Audio CD) benötigt eine Bitrate von 1441 Kbit/s.
Eine MPEG Audio-CD,welche mit FFT417
(Fast Fourier Transformation) komprimiert wurde, benötigt zwischen
192 und 256 Kbit/s.
Eine MPEG Audio-CD mit Tonstudio-Qualität, welche mit FFT417
komprimiert wurde, benötigt 384 Kbit/s.
Anforderungen an die Bitrate für Video
Anforderungen an die Bitrate für Video
Qualität |
Technik oder Standard |
Mbit/s |
Kompr. |
Videokonf. Qualität |
H.261 |
0.21 |
J |
VCR Qualität |
MPEG31-1 |
1.2 |
J |
Broadcast Qualität |
MPEG31-2 |
2-4 (1) |
J |
Studio-Qualität digitales TV |
Unkomprimiert |
ITU-R 601 |
166 |
|
Komprimiert |
MPEG31-2 |
3 bis 6 (2) |
J |
HDTV307 |
Unkomprimiert |
CD-DA |
2000 |
|
Komprimiert |
MPEG31-2 |
25 bis 34 |
J |
Auto
Obige Tabelle zeigt die Anforderungen an die Bitrate für Video abhängig
von der Darstellungsqualität.
Mit dem Standard H.261, welcher von der CCITT453
(Commité Consultatif Internationale Télégrafique et Téléfonique) entwickelt
wurde, können Videos mit Videokonferenz Qualität mit einer Bitrate
von 0,1 Mbit/s in komprimierter Form übertragen werden.
Mit MPEG31-1
Standard kodierte Videos mit VCR Qualität benötigen eine Bitrate von
1,2 Mbit/s und werden komprimiert übertragen.
Broadcast Qualität wird mit MPEG31-2
erreicht. Ein so kodiertes Video benötigt mit den heutigen Implementationen
eine Bitrate zwischen 4 und 7 Mbit/s, mit zukünftigen Implementationen
wird die Bitrate auf 2 bis 4 Mbit/s gesenkt werden können.
Die Übertragung von digitalem TV in Studio Qualität benötigt in unkomprimierter
Form nach ITU-R 601 (internationale Videonorm um Videosignale zu digitalisieren)
eine Bitrate von 166 Mbit/s. Mittels MPEG31-2
kodiert senkt sich die benötigte Bitrate auf 6 bis 10 Mbit/s. Mit
aktuellen Implementierungen in MPEG-4 kann sie weiter auf 3 bis 6
Mbit/s gesenkt werden.
Die unkomprimierte Übertragung von HDTV307
(High Definition Television) nach dem CD-DA Standard benötigt 2000
Mbit/s, mittels MPEG31-2
komprimiert benötigt sie nur mehr eine Bitrate von 25 bis 34 Mbit/s.
Welche Bit-Rate wird gebraucht?
Auto PC
Auto PDA_Phone
Auto
Die Ausgangs-Bitrate der zu übertragenen Daten entspricht nicht genau
der Netzwerk-Bitrate bei der Übertragung. Das liegt daran, dass die
einzelnen Pakete, in welche die Daten zur Übertragung unterteilt werden,
noch um die Header der verschiedenen Übertragungsprotokolle ergänzt
werden müssen (siehe Abbildung). Das ist nötig, damit die Daten an
den Empfänger gesandt werden und damit dieser in der Lage ist, sie
auch richtig auszuwerten.
Die benötigten Protokolle sind ein Echtzeitprotokoll (normalerweise
RTP106), ein
Transportprotokoll (normalerweise UDP141)
und das Internetprotokoll (IP). Ein RTP106
Header benötigt 12 Byte, ein UDP141
Header besteht aus 8 Byte und der IP Header aus 20 Byte.
Zum Beispiel bei Audiodaten, die mit der G.711 Technik komprimiert
werden, benötigen die Ausgangsdaten, wie schon erwähnt eine Bitrate
von 64 Kb/s. Durch das Hinzufügen der einzelnen Protokoll-Header wird
bei der Übertragung allerdings eine Bitrate von 68 bis 80 Kb/s gebraucht.
Jedoch beinhaltet die Sprache auch Pausen. Durch eine Unterdrückung
der Pausen kann die benötigte Bitrate wieder gesenkt werden. Betrachten
wir dieses Phänomen näher.
Sprechpausen
Auto PC
Auto PDA_Phone
Auto
Hält eine Person einen Monolog, so wird durchschnittlich 15% der
Gesamtzeit nicht gesprochen (siehe obige Abbildung).
Auto PC
Auto PDA_Phone
Auto
Eine Studie über die Verteilung von Sprechpausen Thema für Telefongespräche
erstellte Paul Brady bei den Bell Laboratories im Jahre 1969. Er belegte,
dass bei einer normalen Konversation Sprechen und Sprechpausen exponentiell
verteilt sind. So folgt einer Sprechphase von durchschnittlich 400
ms eine Sprechpause von durchschnittlich 650 ms. Dies zeigt, dass
eine Person bei einem längeren Gespräch ungefähr nur 40% der Zeit
spricht (siehe obige Abbildung).
Werden diese Pausen unterdrückt, so ist es möglich die Bitrate bei
der Übertragung im Vergleich zur Bitrate der Ausgangsdaten um bis
zu 40% zu senken.
Übertragungsverzögerungsvariation (Jitter)
1
Auto
- Empfänger muss eine gewisse Start-up Verzögerung
abwarten bevor er die Daten abspielt
- Ermöglicht es, dass verspätete Pakete rechtzeitig eintreffen
- Wird Verzögerungsausgleich genannt
- Steigert die gesamte Ende-zu-Ende Wartezeit
Verzögerungsausgleich-Buffer
Auto PC
Auto PDA_Phone
Auto
Eingehende Pakete werden vom Eingangsbuffer gespeichert
2
Auto
Jitter bezeichnet die Zeitdifferenz
bei der Präsentation der Daten zwischen aufeinanderfolgenden Datenkomponenten
innerhalb einer einzigen Medienkomponente. Jitter ist nur relevant
bei der Übertragung von zeitlich abhängigen Komponenten.
Um den Jitter auf ein möglichst geringes Maß zu reduzieren ist es
möglich mit einem Buffer zu arbeiten. Der Empfänger ist gezwungen
nach Erhalt eines Paketes eine gewisse Start-up Verzögerung zu tolerieren.
So wird es verspäteten Paketen ermöglicht noch rechtzeitig einzutreffen.
Dieses Verfahren wird Verzögerungsausgleich genannt.
Allerdings wird dadurch auch die gesamte Ende-zu-Ende Wartezeit gesteigert.
Der Verzögerungs-Offset ist somit gut zu wählen um einen möglichst
vorteilhaften Kompromiss zwischen der Akzeptanz des Jitters und der
gesamten Wartezeit zu erzielen.
Verzögerungsausgleich-Buffer
Auto PC
Auto PDA_Phone
Auto
Obige Abbildung zeigt einen Buffer
der dem Verzögerungsausgleich dient.
So werden die einzelnen Pakete nach ihrem Eintreffen beim Empfänger
in dem Eingangsbuffer zwischengespeichert. Nach einer gewissen Wartezeit,
dem schon vorhin erwähnten Verzögerungs-Offset, werden die Pakete
in der richtigen Reihenfolge dem Abspielprozess übergeben. Der Buffer
hat den Zweck, dass auch etwas verspätete Pakete noch in der richtigen
Reihenfolge abgespielt werden können.
Inter-media Synchronisation
1
Auto
Inter-media Synchronisation garantiert das korrekte zeitliche Abspielen
zusammengesetzer Medien
Ein bestimmter Fall von A/V Synchronisierung
- Lippen-Synchronisation
Muss nicht genau passen
- Ein Bitversatz von 80-100 ms liegt oft unter der menschlichen
Wahrnehmungsgrenze
Auto PC
Auto PDA_Phone
Audio/Video Prioritäten
- Das Ohr verhält sich als Differenzierer
- Das Auge verhält sich als Integrator
- Die Toleranz von Übertragungsfehlern ist bei Audio wesentlich
geringer als bei Video
- Wenn Audio- und Videoströme als Teil der selben Applikation übertragen
werden und um Netzwerkressourcen konkurrieren,
sollte der Audiostrom Priorität haben.
2
Auto
Auto PC
Auto PDA_Phone
Auto
Inter-Media Synchronisation hat die
Aufgabe, die Aufrechterhaltung der relativen zeitlichen Abhängigkeiten
zwischen verschiedenen zusammengehörigen Medienströmen von deren Erstellung
bis zu ihrer Präsentation, zu garantieren.
Dieser wichtige Quality of Service Parameter bezieht sich auf die
zeitliche Abhängigkeit zwischen separaten Medienkomponenten.
Probleme kann vor allem die scharfe Synchronisation von Audio- und
Video-Datenströmen bereiten. Diese wird als Lippensynchronisation
bezeichnet. Die beiden zusammenhängenden Audio- und Videoströme müssen
nicht exakt gleichzeitig ablaufen. Der Bitversatz, welcher die Zeitdifferenz
zwischen den verschiedenen Medienkomponenten bezeichnet, muss allerdings
unter 100 ms liegen. Denn erst ab einer zeitlichen Differenz von ca.
100 ms wird diese Verzögerung vom Menschen wahrgenommen.
Möglichkeiten, den Bitversatz unter Kontrolle zu halten und die Mediensynchronisation,
falls nötig, wiederherzustellen sind z.B. das Verwerfen von verspäteten
Komponenten oder das Verzögern von schneller eingelangten Komponenten.
Beide Techniken reduzieren das resultierende QoS72.
Audio/Video Prioritäten
Bei der Übertragung von Audio und Video ist grundsätzlich auch die
menschliche Wahrnehmung zu beachten. Das menschliche Ohr verhält sich
als Differentiator, wohingegen das Auge als Integrator wirkt.
Aus diesem Grund werden Übertragungsfehler bei Audioströmen in geringerem
Maße toleriert, als bei Videoströmen.
Demnach ist der Übertragung des Audiostroms Priorität zu gewährleisten,
wenn der Audiostrom mit einem Videostrom der selben Applikation um
Netzwerkressourcen konkurriert.
Bibliographie
2
Auto
Flu95
|