Humboldt-Universität / Rechenzentrum / Publikationen / RZ-Mitteilungen / Nr. 11/1995

Digitales Video

Das D-1-Format - der Standard CCIR 601/4:2:2

Im RZ wird seit reichlich zwei Jahren ein digitaler Video-Diskrecorder (DVDR) vom Typ Abekas A66 betrieben. Er dient der computergestützten Videoproduktion, vorrangig in der Wissenschaftlichen Visualisierung, aber auch zur Realisierung von Projekten der fotorealistischen Video-Filmanimation. Der DVDR mit seiner Arbeitsumgebung ist in zwei Artikeln in den RZ-Mitteilungen [1][2] beschrieben worden.

Ziel dieses Beitrags soll es sein, alle wichtigen verfügbaren Daten zum verwendeten digitalen D-1-Bildformat aufzuschreiben, um sie zum eigenen Gebrauch sowie für die Benutzer unseres Equipments vorliegen zu haben. Solche Daten können aber auch den Betreibern ähnlicher DVDR von Nutzen sein. Die Darstellung ist so angelegt, daß man im wesentlichen ohne weitere Verweise auf die voraufgegangenen Artikel auskommt.

Analoge und digitale Videosignale

Das D-1-Format stellt ein digitales Komponenten-Aufzeichnungsformat dar. Es ist vor etwa 10 Jahren durch den CCIR-Standard 601 (Akürzungen s. Anhang) festgelegt worden und beruht auf Empfehlungen der EBU und der SMPTE. Inzwischen ist es zu einem Weltstandard geworden, weil bei seiner Festlegung sowohl die NTSC- wie die PAL-Norm Berücksichtigung fanden [3] [4].

Das D1-Signal wird durch Digitalisierung analoger Komponentensignale gewonnen.

Abb. 1: Prinzip der Farbfernsehübertragung

Die Entstehung der analogen Komponentensignale zeigt das stark vereinfachte Schema von Farbfernseh-Empfänger- und -Sender in der Abbildung 1 nach [3]. Es wird im folgenden die Sprech- und Bezeichnungsweise der bei uns üblichen PAL-Norm benutzt; die NTSC-Norm arbeitet jedoch nach dem gleichen Prinzip. Die zunächst in der Kamera gewonnenen Signale R,G,B (abkürzend auch: RGB-Signal; R,G,B: Rot, Grün, Blau) werden umgesetzt in das Helligkeitssignal Y (Luminanz-Signal) und die beiden Farbart-Signale (Chrominanz-Signale) U und V. Dieser Umsetzungsvorgang wird auch als Matrizierung bezeichnet.

Das Signal

Y = 0,299 R + 0,587 G + 0,114 B (1)

liefert ein empfindungstreues Helligkeitssignal entsprechend dem einer Schwarzweiß- Kamera und sichert so die Kompatibilität zum Schwarzweiß-Fernsehen.

Die Chrominanz-Signale U und V, auch reduzierte Farbdifferenzsignale genannt [6], werden nach folgender Vorschrift gewonnen:

U = 0,493 (B-Y) (2)

V = 0,877 (R-Y). (3)

Damit ergibt sich für die Transformation vom RGB- in das YUV-System zusammenfassend [4] [5][6] [7]:

Die Signale Y, U, V (abkürzend: YUV-Signal) heißen Komponentensignale.

Zur drahtlosen Übertragung wird aus den Signalen Y,U,V das FBAS-Signal (Farb-Bild- Austast-Synchron-Signal) erzeugt. Das FBAS-Signal, das die gesamte Bildinformation - Leuchtdichte und Farbart - trägt, wird auch Composite-Signal genannt.

Die Rückgewinnung des RGB-Signals aus den Komponentensignalen Y, U, V zur Bilddarstellung auf der Bildröhre ist im unteren Teil der Abbildung 1 angedeutet. Dieser Vorgang wird auch als Dematrizierung bezeichnet.

Komponentensignale spielen in der analogen Farbfernsehtechnik, vor allem im Studiobereich, eine wichtige Rolle [3] [8]. Das von der Firma Sony entwickelte Betacam-System bzw. Betacam-SP-System ist ein Komponenten-System und zur Zeit das wohl ausgereifteste. Hinsichtlich der Wiedergabequalität sind Komponenten-Systeme Composite-Systemen deutlich überlegen [3, S. 456 ff.].

In unserem Sequenzspeichersystem benutzen wir zur Analogaufzeichnung einen Betacam-SP- Recorder der Firma Sony [2]. Ein Digital-Analog-Wandler (DAU) Abekas A26 setzt dazu das im D-1-Format gespeicherte digitale Komponentensignal in das analoge YUV-Signal um.

Digitalisierung

Abtastreihenfolge und Abtastfrequenzen

Nach dem CCIR 601-Standard erfolgt die Digitalisierung der Komponentensignale Y, U, V mit unterschiedlichen Abtastfrequenzen, und zwar Y mit 13,5 MHz und U und V jeweils mit dem halben Wert, also 6,75 MHz. Die Abtastreihenfolge ist in der Abbildung 2 schematisch so dargestellt, wie sie von Watkinson [4] angegeben wird. (Bei Watkinson wird für die Chrominanzsignale U und V (oder die entsprechenden in der NTSC-Norm) die Bezeichnung CB und CR respektive verwendet. Man findet in der Literatur auch Pb, Pr.) Mit diesem Verzicht auf Farbinformation auf Grund der kleineren Abtastfrequenz für die Chrominanz-Signale wird der Datenstrom im digitalen System um ein Drittel gegenüber der vollen Abtastrate reduziert. Diese Vorgehensweise ist dadurch gerechtfertigt, daß das menschliche Auge empfindlicher auf Informationsverluste bei Helligkeitswerten als bei Farbwerten reagiert [4].


Abb. 2: Abtastung der Komponentensignale Y, U, V [4, S. 129 f.]

Bezieht man sich auf eine Grundfrequenz von FG = 3,375 MHz, dann lassen sich mit 13,5 MHz = 4 · FG und 6,75 MHz = 2 · FG die Abtastraten der Komponentensignale Y, U, V durch das Verhältnis 4:2:2 beschreiben. Daher rührt die Bezeichnung des CCIR-Standards 601: CCIR 601/4:2:2.

Die Quantisierung ist mit 8 bit oder auch 10 bit festgelegt. Der von uns benutzte DVDR Abekas A 66 ist ein digitales 8-bit-Komponenten-System. Deshalb wird im folgenden dieser Wert zugrunde gelegt.

Für die Abtastwerte einer Bildzeile wurden nach
[4, S. 387 f.] folgende Festlegungen getroffen:

Bei einem 625-Zeilen/50-Hz-System mit Interlacing (Zeilensprungverfahren) beträgt die Darstellzeit einer Zeile (einschließlich der Zeilenaustastung) T = 64 µs ( T = 1/(625 · 25 s-1) ). Das ergibt N = 864 Abtastungen pro Zeile (N = 64 µs · 13,5 · 106 s-1 ). Von diesen 864 Abtastungen werden 720 zur Gewinnung der Bilddaten der “aktiven" Zeile benutzt. Die Abtastpunkte verteilen sich auf die Bildzeile in folgender Weise:

864 = 132 + 720 + 12.

Die Zählung beginnt an der Vorderflanke des Synchronimpulses, die Abtastung wird also durch ihn gesteuert. Von den ersten 132 und den letzten 12 Abtastungen werden keine Informationen gewonnen und übertragen: Synchronimpulse brauchen in Komponenten- Systemen nicht digitalisiert zu werden. Es genügen die reinen Bildinformationen; alle anderen Bestandteile des Videosignals können später bei der Digital-Analog- Umwandlung neu erzeugt werden.

Datenstrom

Der Datenstrom bei der Digitalisierung nach CCIR 601/4:2:2 ergibt sich (s. [3, S. 212]) zu:

Abtastung Y: 13,50 MHz · 8 bit = 108 Mbit s-1
Abtastung U: 6,75 MHz · 8 bit = 54 Mbit s-1
Abtastung V: 6,75 MHz · 8 bit = 54 Mbit s-1
ingesamt: 216 Mbit s-1

Dieser Datenstrom ist also bei der Digitalisierung von Komponentensignalen zu übertragen. In unserem Sequenzspeichersystem haben wir zur Zeit keine Möglichkeit, PAL-Komponentensignale in (Video-)Echtzeit zu digitalisieren, weil uns kein entsprechender ADU zur Verfügung steht. Allerdings ist die oben angegebene Datentransferrate bei der Ausgabe der D-1-Bilder in Video-Echtzeit vom Abekas A66 auf den DAU Abekas A26 erforderlich. Sie muß also vom A66 geleistet werden und liegt wesentlich höher als die gängiger Festplatten. Zur Arbeit mit unkomprimiertem digitalen Video ist also immer noch Spezialequipment erforderlich [2] [8], das natürlich auch seinen Preis hat!

Die Firma Abekas selbst liefert seit diesem Jahr ein Nachfolgegerät zum A66: das 10-bit-System Abekas A 6100 Diskus mit verbesserter Funktionalität und einer Speicherkapazität von ca. 1 Minute PAL-Video [9].

Ein auf einem Diskarray basierendes System SVF 422 SCSI Video Disk mit einer Quantisierung von wahlweise 8 oder 10 bit und einer 4-Spur-Audio-Option wird von der Firma Bihlmeir angeboten [10]. Die 8-bit-Version besitzt in der derzeit höchsten Ausbaustufe eine PAL-Video-Speicherkapazität von 64 Minuten.

Ein ganz anderer Weg, die Übertragungsraten beim digitalen Video mit “Standard-Technik" zu bewältigen, besteht in der Bilddatenkompression. Inzwischen setzen sich darauf beruhende Syteme in der Praxis überall dort, wo die Informationsverluste durch die Kompression nicht ins Gewicht fallen, mehr und mehr durch [8] [11] [12].

Signalpegel

Für die Aussteuerbereiche der digitalen Komponentensignale Y, U, V (fett zur Unterscheidung von den analogen Signalen!) wird nicht der gesamte mögliche Wertebereich von 0 bis 255 (bei einem 8-bit-System) zugelassen, sondern geringfügig kleinere und zudem unterschiedliche (s. [4, S. 389 f.] ) Wertebereiche.

Seien Y, U, V die analogen Komponentensignale, die man mit 0 <= R, G, B <= 1 nach der Transformationsbeziehung (4) erhält, dann wird der Aussteuerbereich der digitalen Signale durch die folgenden Transformationen festgelegt:

Luminanz:
Y = 219 Y + 16 (5)

Chrominanz:
U = 224 U + 128 (6)

V = 224 V + 128 (7)

mit der zusätzlichen Bedingung:

Das bedeutet für das Luminanzsignal:

also für den Schwarzpegel: Y = 0:
Y = 16

und den Weißpegel: Y = 1:
Y = 235

und für die Chrominanzsignale:

Unbunte Bildsignale mit U = V = 0 haben die Kodierung U = V = 128. Der Nullpunkt liegt also in der Mitte des Aussteuerbereichs.

Nach der Transformationsbeziehung (4) wird der zulässige Wertebereich von V für die Farben

Rot (R = 1, G = B = 0), V = 0,61 und

Cyan (R = 0, G = B = 1), V = - 0,62

bei voller Farbsättigung überschritten, also die Bedingung (9) verletzt!

Die Festlegung dieser Pegelwerte ist selbstverständlich zu beachten, wenn man D-1- Bilder digital bearbeitet, in andere Formate umwandelt etc. Es ist durchaus möglich, synthetisch “falsche" Farbkodierungen zu erzeugen: So sind z.B. die Tripel

(Y, U, V) = (255, 255, 255)

(Y, U, V) = (0, 0, 0)

nach (5) - (8) nicht zulässig (werden aber selbstverständlich vom DAU “irgendwie" interpretiert!).

Bei der bloßen Speicherung und Übertragung digitalisierter Bilder sind die Aussteuerbereiche für den Nutzer bedeutungslos: Sie werden bei der Rückwandlung in analoge Signale durch einen systemkonsistenten DAU natürlich berücksichtigt.

Die im Anhang angegebene RGB-YUV-Transformationsbeziehung (4*), wie sie im AVS- Modul write_a60_yuv verwendet wird [13], erfüllt die Bedingung (9): - 0,5 <= U, V <= 0,5. Untersuchungen zu resultierenden unterschiedlichen Farbempfindungen bei Verwendung von (4) oder (4*) stehen noch aus.

Das D-1-Speichermodell auf dem Abekas A66

Dateistruktur, Dateigröße

Auf dem Abekas A66 werden die Komponenten-Bilddaten als sogenannte QNT- Files gespeichert. Die Abtastwerte für eine (aktive) Zeile (s.o. Abtastreihenfolge) sind darin folgendermaßen angeordnet:

U1 Y1 V1 Y 2 U3 Y3 V3 Y4 U5 Y 5 V5 Y6 ...

... U719 Y719 V719 Y720 . (10)

In (10) sind die Yi , Ui ,Vi die digitalen Abtastwerte der analogen Komponentensignale Y, U, V mit einer Quantisierung von jeweils 1 Byte. Der Index bedeutet den Abtastzeitpunkt (s. Abbildung 2).

Einer Bildzeile entsprechen 720 Y-Werte und jeweils 360 U- und V-Werte, also insgesamt 1440 Byte. Zu einem Vollbild (Bild engl.: Frame) gehören 576 Zeilen, also 1440 x 576 Byte = 829.440 Byte. Im QNT-File sind diese 829.440 Byte ohne zusätzliche Informationen hintereinander abgelegt, und zwar in aufeinanderfolgenden Bildzeilen.

Der zur Ausgabe analoger Bilddaten verwendete DAU Abekas A26 interpretiert nun die QNT-Bilder auf dem A66 entsprechend der PAL-Norm (625 Zeilen/50 Hz) nach dem Zeilensprungverfahren in folgender Weise: Aus den ersten 1440 Byte einer QNT-Datei wird die erste Zeile des ersten Halbbilds (Halbbild engl.: Field) und aus den folgenden 1440 Byte die erste Zeile des zweiten Halbbilds gebildet und so fort. Das Speichermodell einer QNT-Datei auf dem A66 läßt sich mithin im Hinblick auf die Rückgewinnung der analogen aus den digitalen Bilddaten am besten in Form einer Blockmatrix oder Hypermatrix1 beschreiben:

D = (Dij) i = 1...576 (11)
j = 1...360

Die einzeiligen Untermatrizen Di j haben dabei nach (10) folgende Gestalt:

Di j = (Ci (2j-1) Yi 2 j) (12)

mit Untermatrizen

Ci k = (Ui k Yi k Vi k) (13)

Die Yi j , Ui j , Vi j bedeuten wieder die digitalen Komponentensignale, wobei i den Index der Bildzeile und j den Abtastzeitpunkt innerhalb einer Zeile angibt. Nach dem oben Gesagten gilt nun: Die Zeilen mit ungeradem Zeilenindex bilden das erste und die Zeilen mit geradem Zeilenindex das zweite Halbbild. Die Kenntnis dieser Dateistruktur ist von Bedeutung, wenn man synthetisch Halbbilder erzeugen möchte.

Es sei hier darauf hingewiesen, daß in moderner Animationssoftware zur allfälligen Verbesserung des Zeitverlaufs einer bestimmten Animation bei der Video- Wiedergabe die Funktionalität Field Rendering enthalten ist, wobei nicht - wie üblich - beim Rendern eine Folge von Vollbildern (Frames), sondern eine Folge von Halbbildern (Fields) erzeugt wird [14] [15]. Diese Halbbilder müssen nach ihrer Berechnung in der hier angegebenen Weise zu QNT-Files zusammengefügt werden, damit sie der DAU wunschgemäß interpretieren kann.

Farbkodierung

Die Farbkodierung ergibt sich aus der RGB-YUV-Transformationsbeziehung (4) oder (4*) (s. Anhang) und den oben aufgeführten Austeuerbereichen. In der Software des A66 sind QNT-Dateien enthalten, die Farbbalken der Farbart-Folge White, Yellow, Cyan, Green, Magenta, Red, Blue, Black, White (Verwendung der englischen Farbbezeichnungen, um die üblichen Abkürzungen verwenden zu können) mit einem Farbsättigungsgrad von 100% (R, G, B: 0 oder 1 respektive) und 75% darstellen.

Für die QNT-Datei bars100.qnt, also die Farbbalken mit 100% Farbsättigung ist in der folgenden Tabelle die benutzte Farbkodierung zusammengestellt.

Es stellt sich heraus, daß die benutze Farbkodierung auf der RGB-YUV-Tranformation (4*) (s. Anhang) beruht.

Seitenverhältnis

Ein D-1-Bild hat, wie oben angegeben, eine Ausdehnung von 720 Pixel pro Zeile und 576 Zeilen. Das dazugehörige “analoge" Bild wird auf einem Fernsehbildschirm mit einem Seitenverhältnis von 4 : 3 dargestellt [4]. Bei dieser Vorgabe ergibt sich für das Verhältnis der horizontalen Ausdehnung h zur vertikalen Ausdehnung v eines Pixels (Pixel Aspect Ratio [15]) im D-1-Bild aus der Beziehung

der Wert

Diesen Wert des Pixel Aspect Ratio muß man beim computergestützten Erzeugen von D-1-Bildern stets in Rechnung stellen, wenn man maßstabsgerechte Bilder auf dem Fernsehbildschirm erhalten will.

In den Softwaresystemen Wavefront [14] und Alias [15] ist dieser Wert zur Ausgabe von PAL-Bildern auf den Abekas A66 einstellbar. Im Visualisierungssystem AVS [16] besteht eine solche Möglichkeit bisher leider nicht.

Tabelle: Farbcodierung Abekas A66 - QNT-Datei bar100.qnt


1 Zurmühl, R.; Falk, S.: Matrizen 1. Grundlagen. Springer-Verlag, 1992, 6. Auflage.
Anhang

Standard CCIR-601/4:2:2
Digitales Komponenten-Aufzeichnungsformat

Abtastfrequenzen:
für Luminanzsignal (Helligkeitssignal) Y: 13.5 MHz
für Chrominanzsignale (Farbartsignale) U, V: 6.25 MHz

Datenstrom (8-bit-System):
27 MByte/s

Bildformat (QNT-File Abekas A66) - Vollbild (Frame):
Zeilen: 576
Bildpunkte pro Zeile: 720
3 Byte: Y, U, V und 1 Byte: Y pro Pixel abwechselnd
2 Halbbilder (Fields) im Zeilensprung-(Interlacing-)Verfahren angeordnet.

Datenmenge eines Vollbildes:
576 ˜ 720 ˜ 2 Byte = 829440 Byte

Andere digitale Formate:
D-2: Composite-Format
D-3: Composite-Format
D-5: Komponenten-Format: 13,5 MHz/10 bit oder 18 MHz/8 bit
DCT: Digital Component Technology (Fa. Ampex): Datenreduziertes Komponenten-Format
Digital Betacam (Fa. Sony): Datenreduziertes Komponenten-Format 8 bit/10 bit/4:2:2.

RGB-YUV-Transformation nach AVS [13]

Zusammenstellung wichtiger Abkürzungen
ADU: Analog-Digital-Umsetzer
AVS: Application Visualization System, Visualisierungssystem, Fa. Advanced Visual Systems
BAS: Bild-Austast-Synchron(-Signal)
CCIR: Comité Consultatif International des Radio-Communications
DAU: Digital-Analog-Umsetzer
DVDR: Digital Video Disk Recorder
EBU: European Broadcast Union
FBAS: Farb-Bild-Austast-Synchron(-Signal)
NTSC: National Television Committee
PAL: Phase Alternating Line
SMPTE: Society of Motion Pictures and Television Engineers


Literatur

[1]
Suschke, E.: Multimedia-Service am Rechenzentrum - erste Ansätze und Perspektiven. RZ-Mitteilungen, Nr. 5, 1993, S. 16-22. Berlin: Humboldt-Universität, RZ.

[2]
Suschke, E.: Videofilmanlage. d.o., Nr. 6, 1993, S. 26-33.

[3]
Webers, J.: Handbuch der Film- und Videotechnik. München: Franzis, 1993, 4. verb. Aufl., DM 128,-.

[4]
Watkinson, J: The Art of Digital Video. Oxford, London...:Focal Press, 1994, 2nd ed., 704 S., DM 122,-.

[5]
Stotz, D.: Computergestützte Audio- und Videotechnik: Multimediatechnik in der Anwendung. Berlin;...: Springer, 1995, 432 S., DM 78,-.

[6]
Telefunkenfachbuch Farb-Fernseh-Technik I. Ulm: Telefunken, 1966, 170 S.

[7]
Mäusl, R.: Fernsehtechnik. Heidelberg: Hüthig, 1991, 2. Aufl., 243 S., DM 68,-.

[8]
Svatek, W.; Lesowsky, S.: Professionelle Videobearbeitung.
München: Franzis-Verlag, 1994, 320 S., DM 128,-.

[9]
Abekas ADDR6100 Digital Disk Recorder Diskus. Firmenschrift. Redwood City CA: Abekas, 1995.

[10]
SVF 422 SCSI Video Disk. Firmenschrift. München: Bihlmeir Datentechnik, 1994.

[11]
Meissner, H.: Digitale Multimediasysteme. Berlin: Verlag Technik, 1994, 187 S.

[12]
Ohm, J.-R.: Digitale Bildkodierung: Repräsentation, Kompression und Übertragung von Bildsignalen.
Berlin; ...: Springer, 1995.

[13]
Myerson, T.: AVS-Module write_A60_yuv.c. International AVS Center.
North Carolina Supercomputing Center, 1994.

[14]
Wavefront Advanced Visualizer Reference Guide,
Version V 4.0, 1993. Professional Composer User's Guide, Version 3, 1994.
Santa Barbara, CA: Wavefront Technologies, Inc.

[15]
Alias Reference Guide - Book 2. Toronto, Canada: Alias Research Inc., 1994.

[16]
AVS Reference Manuals. Waltham, MA: Advanced Visual Systems, 1993.

Edmund Suschke


15.1.96 / cs
letzte Änderung: 23.1.96, 12:00, lw