Home - improve
Unser Angebot
Presse-Forum
Veröffentlichungen
Referenzen
Kontakt
Termine
Logo Improve

Multimedia Digital mit DVI und Indeo

Von Klaus Eppele

Die zwischenmenschliche Kommunikation ist von Natur aus multimedial: Wir sprechen, schreiben, zeichnen, gestikulieren, zeigen, musizieren, sehen, hören und fühlen. Mit der fortschreitenden Computertechnologie wurden Werkzeuge und Hilfsmittel geschaffen, die diese natürlichen Formen der zwischenmenschlichen Kommunikation auch für die Schnittstelle Computer/Mensch verfügbar machten. Insbesondere geht der Trend zum Bewegtbild auf dem Computer - und das schon seit mehreren Jahren.

Früher war die Integration von Bewegtbild in Computeranwendungen nur durch Analogtechnik realisierbar. Videosequenzen in interaktiven Schulungen, Point of Information-Kiosken, Video-Datenbanken oder verkaufsunterstützenden Präsentationen bedurften des Einsatzes von Bildplattenspielern oder Videorekordern. Diese Geräte lassen zwar eine Wiedergabe, aber keine direkte Manipulation oder Weiterverarbeitung der dort abgelegten Ton- und Videosequenzen zu. Die Akzeptanz der noch heute anzutreffenden Hybridsysteme (digitale Computer vereint mit analogen Speichermedien) leidet unter folgenden Nachteilen:

  • Hohe Anschaffungskosten für die zusätzlichen Analogsysteme
  • Hohe Produktionskosten der Datenträger
  • Rasche Abnutzungs- und Alterungsprozesse
  • Technische Probleme (z.B. Bandsalat beim Videorekorder)
  • Analoge Übertragungsfehler
  • Umständliche Verfahren zum Update der Bildinformationen (selbst bei kleinen Änderungen müssen alle Datenträger neu produziert und verteilt werden), dadurch
  • Hoher Kosten- und Zeitaufwand und
  • Geringer Aktualisierungsgrad räumlich verteilter Hybridstationen.

Dies verdeutlicht, dass sich videounterstützte Multimedia-Systeme nur dann wirtschaftlich realisieren lassen, wenn alle Bestandteile einer Applikation auf nur einem Datenträger in digitaler Form zur Verfügung stehen. Digitales Video ist die Zukunft von Multimedia am Computer, denn Digitalisierung macht unabhängig von unterschiedlichen Videostandards wie PAL oder NTSC (Phase Alternating Line, National Television System Committee). Ein digitales PAL-Video hat exakt die gleiche Datenstruktur wie ein digitales NTSC-Video. Zudem ist man an kein bestimmtes digitales Speichermedium gebunden. Alles ist möglich: Videos können von der CD-ROM, der Festplatte oder vom Netzwerk abgespielt werden.

Bei der Digitalisierung von Bewegtbild fallen jedoch grosse Datenmengen an. Unter Berücksichtigung des CCIR.601-Standards (internationaler Standard für die digitale Codierung von Komponentenfarbfernsehen) hat ein Videobild eine Auflösung von 720 * 576 Pixels für das Luminanzbild (Y) mit 8 Bit Helligkeitsauflösung und eine verringerte Auflösung von je 360 * 576 Pixels für die Farbdifferenzbilder (U und V) bei 8 Bit Farbauflösung. Bei einer Bildwiederholfrequenz von 25 Herz ergibt sich für eine Videosequenz von einer Sekunde ein Speicherbedarf von: Y+U+V=((720*576*8Bit)+(360*576*8Bit)+(360*576*8Bit))*25 Bilder = 165.890.000 Bit bzw. 20,736 Megabyte.

Diese Datenflut überfordert heute übliche Personalcomputer - zusätzliche Hardware ist erforderlich, die die Digitalisierung der zu verarbeitenden Bilddaten übernimmt und dafür sorgt, dass die Informationen so weit komprimiert werden, dass sie von Speichermedien in Echtzeit verarbeitet werden können. CD-ROM-Laufwerke arbeiten beispielsweise häufig noch mit einer Datenübertragungsrate von 150 Kilobyte pro Sekunde. Damit von diesen Datenträgern Video nach CCIR.601 abgespielt werden kann, muss die Information etwa um den Faktor 140:1 (20.736:150) verdichtet werden, so dass die 150 KByte/sec Übertragungsrate zur Übertragung der Videodaten ausreichen.

DVI - Digitale Verarbeitung großer Informationsmengen

1989 brachten Intel und IBM erste DVI-Produkte (Digital Video Interactive), die ActionMedia-750-Karten, auf den Markt. Diese wurden im Oktober 1991 von der nächsten Generation, den leistungsfähigeren ActionMedia-II-Karten, abgelöst.

Bild 1: ActionMedia II Delivery- und Capture-Board

Die DVI-Hardware besteht aus einer PC-Erweitungskarte (Delivery-Board), die um eine Zusatzplatine (Capture-Board) erweitert werden kann. Das Capture-Board digitalisiert analoge Signalquellen wie Video und Ton und leitet die Daten dann an das Delivery-Board zur Bearbeitung weiter. Als Signalquelle kann sowohl Kamera, Bildplatte als auch Videorekorder eingesetzt werden. Das Delivery-Board ist für die Komprimierung und Speicherung oder die Wiedergabe von Video, Bildern und Audio in einer interaktiven Umgebung zuständig. Zum Entwickeln von DVI-Applikationen werden beide Karten benötigt, eine reine Wiedergabestation braucht nur das Delivery-Board. Während Delivery-Boards ausser von Intel und IBM auch von verschiedenen anderen Herstellern, wie Fast Electronic oder Ace Coin, zum Preis von etwa 2.500 bis 4.500 DM zu beziehen sind, ist das Capture-Board nur direkt von Intel zu bekommen. DVI steht derzeit für IBM-kompatible PCs mit 80386- oder 80486-Prozessor und ISA-Bus (International Standard Architecture) oder Micro Channel, Apple Macintosh mit NuBus und SUN zur Verfügung. Unterstützt werden die Betriebssysteme/Bedieneroberflächen DOS, OS/2, Windows und System 7. Auch Laptops können um DVI erweitert werden - die Fast-Karte besitzt eine Option zum Anschluss an das Farb-LC-Display des Toshiba-Laptops T6400.

Bild 2: Das DVI-Board von Fast Electronic

DVI unterstützt drei Kompressionsalgorithmen. PIC (Picture Image Compression) für Standbilder sowie RTV- (Real Time Video) und PLV- (Production Level Video) Kompression für Bewegtbilder. Real Time Video (RTV) bietet eine Auflösung von 256 * 240 Bildpunkten. Es kann, wie der Name bereits sagt, vom Anwender selbst in Echtzeit mit der Capture-Option erstellt werden. RTV ist ein verlustbehaftetes Verfahren. Ein spezieller Algorithmus entfernt alle nichtrelevanten Bildinformationen. Dennoch ist die Qualität von RTV ausreichend für die meisten Anwendungen in den Bereichen Präsentation, Video-Datenbanken und Point of Information. Für Anwendungen mit höchsten Ansprüchen steht das PLV-Verfahren zur Verfügung, das für die Darstellung eine Auflösung von 512 * 480 Bildpunkten unterstützt. Production Level Video kann nicht vom Anwender selbst, sondern nur offline von Intel oder von speziellen Studios mittels Parallelrechnern realisiert werden. Beim Abspielen der Videos sorgt DVI dafür, dass bei Vollbilddarstellung die Zwischenwerte berechnet (interpoliert) werden, so dass eine gute Bildqualität erreicht werden kann.

Die DVI-Technologie macht sich zunutze, dass die Unterschiede zwischen den einzelnen Bildern in einer Filmsequenz nicht sehr gross sind. Deshalb werden, analog zur MPEG-Norm (Motion Picture Expert Group), nur die Unterschiede zwischen zwei aufeinanderfolgenden Einzelbildern abgespeichert (interframe coding). Bei der Kompression unterscheidet man öIntra-Framesö und öPredicted Framesö. Intra-Frames dienen als regelmässig wiederkehrende Aufsetzpunkte - alle Pixels eines Intra-Frames werden gespeichert. Zwischen zwei Intra-Frames liegen die Predicted Frames, die nur die Pixelveränderungen zum vorhergehenden Bild beinhalten. Da das menschliche Auge nicht sehr farbempfindlich ist, kann man bei der Kompression auch auf einen Teil der Farbinformation verzichten. Durch geeignete Interpretation kann die fehlende Farbinformation bei der Wiedergabe auf mathematischem Weg zurückgewonnen werden. Die Kompression der Audio-Signale erfolgt nach dem ADPCM-Verfahren (Adaptive Differential Pulse Code Modulation), das ebenso nur die Tondifferenzen speichert.

Kernstück des DVI-Boards ist der programmierbare i82750-Chipsatz von Intel, bestehend aus dem Pixel-Prozessor i82750PB und dem Display-Prozessor i82750DB. Die Programmierbarkeit der Chips gibt die Sicherheit, dass die verwendeten Komprimieralgorithmen jederzeit auf den neuesten Stand gebracht werden können. Damit können sich DVI-Produkte, im Gegensatz zu Prozessortechniken mit festverdrahteter Funktionalität, flexibel an zukünftige Standards und Anwendungen anpassen. Welche Aufgaben kommen den einzelnen Bausteinen bei der Video-Wiedergabe zu?

Bild 3: Aufbau des ActionMedia II Delivery-Boards

Die digitalen Video- und Audio-Daten werden bei der ISA-Karte über einen eigenen SCSI-Anschluss (Small Computer System Interface) von der CD-ROM auf die Karte übertragen. Die in Bild 3 gezeigte Delivery-Karte auf MCA-Basis enthält keinen SCSI-Anschluss. Die Daten kommen hier über den Micro Channel.

Der noch komprimierte Datenstrom wird in einen Datenpuffer des Video-RAM kopiert. Die Karte ist mit 2 MB VRAM konfiguriert und kann auf bis zu 4 MB VRAM erweitert werden.

Der 82750PB aktiviert einen im Chip integrierten Algorithmus, der die Daten in einen Video-Datenstrom und zwei Audio-Datenströme (Stereo) separiert.

Die Audio-Daten werden vom Audio-Digital-Signal-Prozessor dekomprimiert, mit dem Video-Datenstrom synchronisiert, in analoge Signale umgewandelt und über den Audio-Output ausgegeben.

Der Pixelprozessor dekomprimiert die Videodaten mit einer Taktrate von 25 MHz, wobei er bis zu sechs Instruktionen parallel ausführen kann. Da der Prozessor voll programmierbar ist, kann er, abhängig vom gerade geladenen Mikroprogramm, parallel zur Dekomprimierung einzelne Bilder mit unterschiedlichen Effekten (z.B. Zooming) bearbeiten. Die dekomprimierten Bilddaten werden als Bitmaps im VRAM abgelegt. Da jeder Bildpunkt durch einen Parameter Y für seinen Helligkeitswert und zwei Parametern U und V für seinen Farbwert beschrieben wird, müssen dabei für jedes YUV-Bild drei unterschiedliche Bitmaps angelegt werden - eine Bitmap für jeden Parameter.

Der Displayprozessor 82750DB führt die zweidimensionale UV-Interpolation aus, transformiert die YUV-Information in das RGB-Format, sorgt für die Digital/Analog-Wandlung durch den Video D/A-Wandler und generiert die nötigen Kontroll- und Synchronisations-Signale. Der 82750DB arbeitet hierbei mit einer Taktfrequenz von 45 MHz. Er erreicht eine maximale Bild-Auflösung von 1024 * 512 Bildpunkten bei True-Color-Darstellung (16,7 Mio. Farben).

Auf einer CD-ROM kann man nur etwa 30 Sekunden unkomprimiertes Bewegtbild nach CCIR.601 (siehe oben) abspeichern. DVI erlaubt eine Kompression von bis zu 160:1, so dass nun auf eine Silberscheibe bis zu 72 Minuten Videofilm passen. Statt dem Film finden auch 44 Stunden Musik, 40.000 Einzelbilder oder 650.000 Seiten Text auf einer CD-ROM Platz.

Des Pudels Kern - Der Audio Video Kernel

ActionMedia II-Produkte bieten eine flexible API-Schnittstelle (Application Programming Interface) - den Audio Video Kernel (AVK). Die AVK-Architektur sorgt für den multimedialen, system- und betriebssystemunabhängigen Datenaustausch. Die Anpassungsfähigkeit an schnellere Prozessoren, neue Rechnersysteme, sich ändernde Bedieneroberflächen oder Betriebssysteme wird durch AVK sichergestellt. Die AVK-System-Architektur besteht aus drei Schichten.

Bild 4: Die drei Schichten der AVK-Architektur

Die Schicht eins, die Microcode-Engine, enthält verschiedene Mikrocode-Routinen für den 82750PB-Prozessor. Zum Beispiel findet sich hier eine Routine namens DoMotion, die die Tasks und Puffer zur Dekomprimierung verwaltet, oder die Routine CopyScale, die Videobilder in Echtzeit skaliert und in den Displaypuffer kopiert.

Die nächste Schicht wird vom Audio/Video-Treiber (AVD) gebildet. AVD liefert u.a. Funktionen zum Zugriff auf das lokale Video-RAM und zum Laden von Mikrocode-Funktionen vom VRAM in den Befehlsspeicher des 82750PB. Dies gibt AVK die Fähigkeit, sich an künftige Funktionen und neue Algorithmen anzupassen. AVD fungiert als Schnittstelle für das Audio-Subsystem und die Video-Capture-Karte.

Die dritte Schicht ist die Audio/Video-Bibliothek (AVL). Sie unterstützt die Datentypen, die zur Manipulation von Video und Audio gebraucht werden. Unterschiedliche Datenströme können zu Gruppen zusammengefasst und gemeinsam über Funktionen wie Play, Pause, Stop,... kontrolliert und synchronisiert werden. AVL ist vollkommen hardwareunabhängig und kann leicht auf andere Systeme portiert werden.

šber den drei Schichten liegt die von der jeweiligen Umgebung abhängige API-Schnittstelle. Da diese Schnittstelle für jedes System optimiert werden muss, wird sie nicht als Teil des portablen AVK betrachtet. Bekannte APIs, die auch als Schnittstelle zu AVK genutzt werden können, sind das für Microsoft Windows 3.1 definierte Media Control Interface (MCI) oder QuickTime von Apple.

In dubio pro Indeo

DVI hat einen Nachteil - in Relation zum PC sind Capture- und Delivery-Board relativ teuer. Dies ist wohl der Grund dafür, dass DVI nur schleppend vom Markt akzeptiert wird. Intels softwarebasierde skalierbare Videotechnologie Indeo (Intel Video) soll dieses Problem meistern helfen. Indeo ist eine neue Aufnahme- und Wiedergabetechnik für digitales Video im Computer. Mittels Indeo können digitale Videos auch ohne DVI-Prozessor aufgenommen und abgespielt werden. Der Hauptprozessor des Computers (80386 oder 80486) übernimmt die Dekompression und die Kompression der Videodaten.

Zum Abspielen von DVI-Videos braucht man nur die entsprechende Software, die bereits mehrere führende Firmen der PC-Industrie in ihre Mulitmedia-Produkte integriert haben: Microsoft in öVideo for Windowsö, IBM in öPresentation Manager for OS/2 Multimediaö und Apple in öQuickTime for Windowsö. Ausser einer Soundkarte wird keine zusätzliche Hardware benötigt. Je nach Rechenleistung des PCs müssen jedoch Abstriche an Bildrate, Auflösung oder Farbtiefe in Kauf genommen werden. Je grösser die zur Verfügung stehende Rechenleistung, um so mehr Videoinformation kann dargestellt werden (Bild 5).

Bild 5: Bildqualität in Abhängigkeit vom Prozessortyp. Die Auflösung von 640 * 480 Bildpunkten kann nur mittels der Zusatzsoftware öHigh Datarate Videoö von Duck Corp. erzielt werden (Quelle: Intel).

Zur Erzeugung einer Videodatei nach der Indeo-Technologie kann auf zusätzliche Hardware nicht verzichtet werden. Es stehen zwei Methoden zur Verfügung: die Zwei-Schritt-Methode und das Echtzeitverfahren. Die Zwei-Schritt-Methode ist sehr speicher- und zeitintensiv. Die Videobilder werden hierbei zuerst von einer Video-Overlay-Karte (ScreenMachine, VideoBlaster,..) digitalisiert und auf der Festplatte abgelegt. In einem zweiten Durchlauf werden die digitalisierten Einzelbilder vom 80386/486 komprimiert. Um beispielsweise eine Minute komprimierten Videofilm der Auflösung 320 * 240 Pixels mit 24 Bit Farbtiefe zu erhalten, sind etwa 345,6 MByte (320 * 240 * 24 Bit * 25 Bilder * 60 sec) Festplattenplatz zur Aufnahme der unkomprimierten Daten und etwa acht Minuten Rechenzeit für die nachträgliche Komprimierung nötig. Im Echtzeit- oder Ein-Schritt-Verfahren wird das Digitalisieren und das Komprimieren von einer i750-basierenden Aufnahmetechnik während des Einspielens des Videosignals durchgeführt. Es wird sofort eine komprimierte Datei erzeugt, die anschließend mit oder ohne i750-Videoprozessor abgespielt werden kann.

Um trotz preiswerter Softwarelösung wieder die i750-basierende Hardware ins Spiel zu bringen, bietet Intel nun ein spezielles Real-Time-Video-Developers-Kit an, das aus einem ActionMedia II Delivery-Board ohne SCSI-Schnittstelle mit nur einem MByte Video RAM und einem Capture-Board besteht. Das preisreduzierte Kit kann Indeo Video mit einer Auflösung von 320 * 240 Bildpunkten aufnehmen und mit bis zu 30 Bildern pro Sekunde wiedergeben. Es ist aber nicht DVI-kompatibel, wenn nicht zusätzlich entsprechende DVI-Treiber installiert werden.

Die Einbindung über Indeo in „Video for Windows“, „Presentation Manager“ und „QuickTime“ sorgt für eine bessere Akzeptanz, die die die Indeo/DVI-Software- und -Hardwareentwicklungen forcieren wird. Die DVI-Technologie erhält somit eine Chance zur weiteren Verbreitung.

 

Autor

Der Autor Dipl. Inform. Klaus Eppele ist Inhaber der Firma improve marketing-training-consulting, Karlsruhe, www.improve-mtc.de.

improve
marketing-training-consulting
Dipl. Inform. Klaus Eppele
Heinrich-Weitz-Str. 31
76228 Karlsruhe
Tel: 07 21 / 94 74 6-21
Fax: 07 21 / 94 74 6-22
eMail:
eppele@improve-mtc.de
URL:
http://www.improve-mtc

Erschienen in MMPro 03/93, Seite 8 - 11