Home - improve
Unser Angebot
Presse-Forum
Veröffentlichungen
Referenzen
Kontakt
Termine

Was ist Multimedia?

Teil 2 von 7 - Bildkompression und Speichermedien

Im ersten Teil dieser Serie wurden einige Anwendungsmöglichkeiten und der Markt für Multimedia betrachtet. Am Beispiel der MPC-Definition wurde gezeigt, welche Komponenten einen Multimedia-PC ausmachen. Weiterhin wurden Kompressionsprinzipien und Einsatzgebiete für Audio erläutert.

Von Klaus Eppele

Bereits bei der Besprechung des ADPCM-Kompressions-Verfahrens war deutlich geworden, dass in Multimedia-Anwendungen oft riesige Datenmengen zu verwalten sind (z.B. für Stereo-Sound 176,4 KByte pro Sekunde). In dieser Folge wird diese Problematik vertieft. Zum einen wird am Beispiel JPEG die Kompression von Bilddaten erläutert, zum anderen werden verschiedene Speichermedien auf ihre Multimedia-Tauglichkeit untersucht, wobei der Schwerpunkt auf Compact Discs gelegt wird.

Ein Bild sagt mehr als tausend Worte

Multimedia wird erst interessant durch hochauflösende Grafiken, Animationen und Bewegtbild. Problematisch ist hierbei, dass so immense Datenmengen anfallen, dass manche Computer schnell überfordert sind. Beispielsweise werden bei voller Ausnutzung der Auflösung eines üblichen 14-Zoll-Monitors mit 1.024 * 768 Pixeln zur Speicherung eines Bildschirminhalts mit 24 Bit Farbtiefe (True Color) bereits 2,359 MByte benötigt. Bei der Digitalisieung von Bewegtbild unter Berücksichtigung des CCIR.601-Standards (internationaler Standard für die digitale Codierung von Komponentenfarbfernsehen) ergibt sich für eine Videosequenz von einer Sekunde sogar ein Speicherplatzbedarf von 20,736 MByte.

Die Lösung sind moderne Kompressionsalgorithmen, die die Datenmengen reduzieren, ohne dass man einen erheblichen Qualitätsverlust wahrnimmt.

Hilfreicher Verlust durch JPEG

Schon 1988 hat sich die Joint Photographic Expert Group (JPEG) zusammengetan, um erstmals weltweit einen Kompressionsstandard für Standbilder zu etablieren. Der bereits von der ISO genormte JPEG-Standard hat sich schnell druchgesetzt und wird mittlerweile von nahezu allen Hard- und Softwareherstellern für die Standbildverarbeitung eingesetzt. Er wird im folgenden beschrieben:

Das 8 * 8 Blockformat

Ausgangspunkt für die Kompression ist ein vom Monitor zeilenweise abgetastetes Bild, das durch die Farbanteile für Rot, Grün und Blau (RGB) dargestellt wird. Die Intensität jeder Farbe wird mit einer Auflösung von acht Bit digitalisiert, so dass je Bildpunkt 24 Bit benötigt werden. Für die Bearbeitung mit JPEG wird die Zeilendarstellung in ein Blockformat von je 8 * 8 Bildpunkten für jede der Farben Rot, Grün und Blau umgesetzt. Bei voller Ausnutzung der Auflösung eines 14 Zoll-Monitors mit 1.024 * 768 Bildpunkten und einem Pixelabstand von 0,28 Millimetern haben die Blöcke eine Kantenlänge von 2,24 Millimetern.

Bild 1: Die Helligkeit und Farbe mit der die einzelnen Bildpunkte oder Pixel (Picture Elements) leuchten wird durch das RGB-Signal bestimmt. Für JPEG wird das Gesamtbild in Blöcke zu 8 * 8 Pixel zerlegt. Je Block wird eine Matrix für Rot-, Grün- und Blau-Information benötigt. (Quelle: mc)

Änderung des Farbmodells

Obwohl das zu verwendende Farbmodell nicht Gegenstand der JPEG-Norm ist, werden die besten Ergebnisse erzielt, wenn das vom Farbfernsehen bekannte YUV-Modell gewählt wird. Bei diesem Modell wird für jeden Bildpunkt die Helligkeit Y (Luminanz) sowie Farbton U und Farbsättigung V (Chrominanz) gespeichert. Das YUV-Format wird verwendet, da die hier gespeicherten Werte der Wahrnehmungsfähigkeit des menschlichen Auges besser entsprechen. Das menschliche Auge kann örtliche Helligkeitsunterschiede sehr viel besser auflösen und unterscheiden als Farbänderungen, so dass die voneinander unabhängigen Y- und UV-Werte mit unterschiedlichem Kompressionsverhältnis reduziert werden können. Hinzu kommt, dass Bildregionen mit gleicher Helligkeit oder gleicher Farbsättigung wesentlich häufiger sind als Bildregionen mit gleichen Anteilen an Rot, Grün und Blau. Im YUV-Format haben daher weite Strecken der Pixeldaten, insbesondere für die Helligkeit, gleiche oder ähnliche Werte. Solche Strecken lassen sich wesentlich stärker komprimieren, als Daten, in denen sehr viele verschiedenen Werte vorkommen.

Bild 2: Der Zusammenhang zwischen U und V geht aus dem Farbdiagramm hervor. (Quelle: mc)

Die Transformation von RGB nach YUV erfolgt durch eine einfache Matrizenmultiplikation. Die YUV-Komponenten ergeben sich als gewichtete Summe aus den RGB-Komponenten (Y = 0,299 * R + 0,587 * G + 0,114 * B, U = - 0,169 * R - 0,3316 * G + 0,500 * B, V = 0,500 * R - 0,4186 * G - 0,0813 * B). Bei dieser Transformation wird der Wahrnehmungsfähigkeit des menschlichen Auges Rechnung getragen. So wird beispielsweise wegen der höheren Empfindlichkeit des menschlichen Auges für Grün bei der Berechnung des Y-Wertes die Grünkomponente am stärksten berücksichtigt (Faktor 0,587).

Bild 3: Transformation von RGB nach YUV mittels Matrizenmultiplikation. (Quelle: mc)

Subsampling

Vor dem eigentlichen JPEG-Prozess kann nun die erste Datenreduktion vorgenommen werden. Da das Auge nicht so viele Farbdetails wie Helligkeitsdetails unterscheiden kann, ist es nicht notwendig, beide mit derselben Genauigkeit abzutasten. Anstatt YUV im Verhältnis 4:4:4 abzutasten, kann ein Subsampling (Unterabtastung) von 4:2:2 gewählt werden. Der Kompressionsgewinn hierdurch beträgt 3:2.

Die Diskrete Cosinus Transformation DCT

Der erste Schritt des eigentlichen JPEG-Algorithmus ist die Diskrete Cosinus Transformation, die einer Fouriertransformation sehr ähnlich ist. Sowohl für den Helligkeits- als auch für den Farbverlauf innerhalb eines jeden 8 * 8 Blocks gilt, dass jeder Funktionsverlauf mit beliebigen Werten f(x,y) mit x,y = 0 bis 7 durch šberlagerung der 64 Grundfunktionen (G) der Diskreten Cosinus Transformation G(u,v) = (cos((2x+1)u*pi/16)*cos((2y+1)v*pi/16)), mit u,v = 0 bis 7 dargestellt werden kann in der Form f(x,y) = 1/4 (C(0,0)/2*G(0,0) + C(0,1)*G(0,1) + ... + C(7,7)*G(7,7)). Der Anteil der einzelnen Grundfunktionen an der Gesamtfunktion wird durch die Vorfaktoren C(u,v) bestimmt. Diese Vorfaktoren werden auch als DCT-Koeffizienten bezeichnet. Für Ihre Berechnung dient die FDCT (Forward DCT) in Bild 4. Die DCT-Koeffizienten geben an, wie gross der Anteil einer Funktion an der Bildinformation ist und sortieren die Gesamtinformation nach verschiedenen Frequenzen.

Bild 4: Die Formeln für die Diskrete Cosinus Transformation, wie sie bei JPEG verwendet werden

Man erhält je 8*8-Block drei Matrizen mit DCT-Koeffizienten. In jeder Matrix steht links oben der DC-Koeffizient (Gleichanteil), nach rechts und nach unten hin stehen die sogenannten AC-Koeffizienten der höherfrequenten Grundfunktionen. Durch Analysieren vieler Bilder konnte man feststellen, dass sich die Bildinformation im wesentlichen in den Koeffizienten in der linken oberen Ecke jeder Matrix konzentriert. Die höherfrequenten Grundfunktionen tragen kaum oder gar keine Information, so dass die zugehörigen Koeffizienten in der Matrix meist Null sind.

Sieht man von der Rechenungenauigkeit bei Matrizenmultiplikation und DCT ab, so ist bis auf das optionale Subsampling, das für das menschliche Sehvermögen unwesentlich ist, das Verfahren bisher nicht verlustbehaftet und umkehrbar. Allerdings hat man bis auf das Subsampling bisher auch keine Reduzierung der Daten erreicht, sondern diese nur für eine Kompression optimiert.

Bild 5: Beispiel für die zweidimensionale DCT. Dargestellt ist ein Übergang von hell nach dunkel. Die erste Matrix zeigt die 64 Luminanzwerte. Die zweite Matrix enthält die DCT-Koeffizienten, die fast alle Null sind. (Quelle: mc)

Die Quantisierung

Die Quantisierung ist der eigentliche verlustbehaftete Prozess beim JPEG-Algorithmus. DCT-Koeffizienten, die sich nicht wesentlich voneinander unterscheiden, werden zu einem Wert zusammengefasst. Dies geschieht, indem man alle Matrizenwerte durch eine vorgegebene Schrittweite dividiert. Neben der Verkleinerung des Wertebereiches erreicht man hiermit, dass noch weitere Koeffizienten höherfrequenter Funktionen zu Null werden. Die Art der Quantisierung ist von JPEG nicht vorgeschrieben. Oft erfolgt die Quantisierung mit Hilfe sogenannter psychovisueller Gewichtsfunktionen. Diese berücksichtigen die Farb- und Helligkeitsempfindlichkeiten des menschlichen Auges und sehen für unterschiedliche Frequenzen unterschiedliche Quantisierungsschrittweiten vor. Erlaubt ist auch, dass der Anwender selbst in den Vorgang der Quantisierung eingreifen kann. Durch Wahl der Quantisierungsschritte kann er so sein Optimum für das Verhältnis Speicherplatz / Bildqualität finden.

Der Zick-Zack-Kurs

Nach der Quantisierung wird der DC-Anteil getrennt von den AC-Teilen behandelt. Weil zwischen den DC-Koeffizienten benachbarter 8*8-Blöcke eine hohe Korrelation herrscht, werden diese nur als Differenz zum vorhergehenden Block codiert. Die AC-Koeffizienten werden in einem Zick-Zack-Kurs aufgereiht. Durch diese Abtastung der Matrix erreicht man, dass die Null-Werte zu zusammenhängenden Abschnitten zusammengefasst werden.

Bild 6: Zick-Zack-Abtastung der Matrizen. (Quelle: mc)

Lauflängen- und Huffmann-Codierung

Bei der anschließenden Lauflängen-Codierung werden aufeinanderfolgende gleiche Werte zu Datenblöcken zusammengefasst. In einem Datenblock wird nur der Wert und dessen Häufigkeit gespeichert. Die aufwendige Abbildung der ursprünglichen Bildinformationen in Folgen von Werten mit großen Nullwertbereichen macht sich jetzt bezahlt.

Im letzten Schritt erfolgt die Huffmann-Codierung. Selten auftretenden Werten werden längere Codeworte zugeordnet als häufig auftretenden Werten. In einem ersten Durchlauf werden die Daten statistisch ausgewertet. Es wird abgezählt, wie häufig bestimmte Werte auftreten. Erst dann wird der optimale Huffmann-Code ermittelt, der zur Codierung herangezogen wird. Die Codeworte werden dabei so gewählt, dass kein Code als Substring am Beginn eines anderen auftritt. Man kann deshalb die Codeworte ohne Trennzeichen hintereinander aufreihen.

Lauflängen- und Huffmann-Codierung sind verlustfreie Prozesse. Von JPEG wird kein spezieller Huffmann-Code vorgegeben. Dies ist sinnvoll, da man somit zum einen die Freiheit hat, über die Wahl des Codes die Qualität des Bildes selbst zu bestimmen, und zum anderen für unterschiedliche Bildvorlagen unterschiedliche Huffmann-Codes verwenden kann, um das Optimum bei der Kompression zu erzielen.

Die Qualität von JPEG

Ohne Quantisierung erreicht die JPEG-Kompression einen Faktor von etwa 20:1. Bis zu diesem Grad sind Qualitätsverluste für das menschliche Auge noch nicht erkennbar, so dass hier auch von överlustfreiem JPEGö gesprochen wird. Abhängig vom Originalbild werden jedoch Qualitätsverluste bei grösseren Kompressionsraten sichtbar. Bis zu einem Kompressionsfaktor 60:1 bleibt die Bildqualität für die meisten Anwendungen ausreichend. Darüber hinaus reagiert man meist sehr empfindlich auf die entstehenden Farb- und Helligkeitsabstufungen.

Bild 7: Beispiel für die Qualität JPEG-komprimierter Bilder: Oben: Originalbild, Mitte: Reduzierung der Bilddaten um 50 Prozent, Unten: die komprimierten Daten betragen hier nur noch 5 Prozent der ursprünglichen Datenmenge. (Quelle: mc)

JPEG-Video / Moving JPEG

JPEG-Algorithmen sind als Software- oder Hardwarelösungen von verschiedenen Anbietern erhältlich. JPEG-Chips sind heute bereits so schnell, dass sie bis zu 40 Bilder pro Sekunde komprimieren und dekomprimieren können und somit auch zum Speichern und Abspielen von digitalem Video herangezogen werden können (die gängigen Fernsehnormen PAL (Phase Alternating Line) und NTSC (National Television System Committee) setzen nur 25 bzw. 30 Bilder pro Sekunde voraus). Bei einer Kompressionsrate von 60:1 pro Einzelbild erreicht JPEG noch Fernsehqualität. Statt den ursprünglichen 20,736 MByte müssen dann vom Computer nur noch knapp 350 KByte verarbeitet werden, was für die Übertragungskapazität von CD-Laufwerken oder manchen lokalen Netzwerken aber noch immer zu viel ist.

MPEG - der Standard für Bewegtbild

Auch MPEG (Motion Picture Experts Group) ist von CCITT und ISO abgesegnet. Während JPEG auf die Komprimierung von Einzelbildern optimiert ist, soll MPEG redundante Daten in Folgen von Einzelbildern erkennen und beseitigen. Dabei macht sich MPEG die Tatsache zunutze, dass sich aufeinanderfolgende Bilder einer Filmsequenz meist nicht stark voneinander unterscheiden. In sogenannten Predicted-Frames merkt sich MPEG deshalb nur die Pixelveränderungen zum vorhergehenden Bild. Als Aufsetzpunkte innerhalb einer Bildsequenz dienen die Intra-Frames, die so gespeichert werden, dass die gesamte Bildinformation wiedergewonnen werden kann. Vorteil von diesem Verfahren ist, dass MPEG einen Kompressionsfaktor von 160:1 erreichen kann und somit mit etwa 125 KByte pro Sekunde Video auskommt. Damit liegt man unter der Übertragungsrate von 150 KByte herkömmlicher CD-ROM-Laufwerke und kann MPEG-komprimiertes Video von CD-ROM abspielen. MPEG hat aber auch Nachteile gegenüber Moving JPEG. Gegenüber JPEG handelt es sich nämlich bei MPEG um ein asymmetrisches Verfahren. Die Kompression ist viel rechenaufwendiger als die Dekompression. Dies führt dazu, dass MPEG im breiten Markt vorerst nur als reine Wiedergabetechnik Verwendung findet und zur Komprimierung teuere Zusatzhardware eingesetzt werden muss. Außerdem können mit MPEG komprimierte Videos nicht rückwärts abgespielt und nicht immer Frame-genau positioniert werden. Dies erschwert die Weiterverarbeitung von MPEG-Videos. Trotzdem stellt MPEG derzeit den Standardalgorithmus für Videokomprimierung dar. Für Ende 1993 ist auch schon die Weiterentwicklung MPEG 2 angesagt, die eine höhere Bildauflösung unterstützen wird.

Speichermedien für multimediale Anwendungen

Auch mit Komprimierungsverfahren fallen bei multimedialen Anwendungen, speziell bei der Nutzung von Realbild- und Tonfolgen, enorm große Datenmengen an. Beispielsweise braucht eine Stunde Moving JPEG immer noch fast 1,3 GByte Speicherplatz. Dadurch wird die Frage nach geeigneten Datenträgern bzw. Speichermedien aufgeworfen. Datenträger, die als Auslieferungsmedium für multimediale Dokumente dienen sollen, müssen mehrere MByte Kapazität bieten sowie preiswert und leicht zu bedienen sein.

Magnetische Datenträger

Die ältesten und gebräuchlichsten Datenträger im PC-Bereich, Disketten und Festplatten, verwenden rein magnetische Aufzeichnungsverfahren. Diese Technologie ist bewährt und liefert verhältnismäßig preiswerte und zuverlässige Speichermedien. Speziell Festplatten sind zudem auch ein ausgesprochen schnelles Speichermedium. Das betrifft nicht nur die Zugriffszeit - jeder Datensatz auf einer Festplatte kann in wenigen Millisekunden gelesen oder geschrieben werden - sondern auch die Übertragungsraten. Moderne Festplatten bieten eine Zugriffszeit nahe 10 Millisekunden und können, abhängig vom Übertragungsverfahren und vom Anschluss, zwischen 0,25 und 10 MByte Daten pro Sekunden aufzeichnen und wiedergeben.

Während Disketten aufgrund der geringen Kapazität von lediglich 0,7 bis 1,5 MByte als Multimedia-Speichermedium völlig ungeeignet sind, reichen heute übliche Festplatten für die Speicherung kürzerer Bild- oder Tonfolgen aus. Schnelle Festplatten sind zudem bei der Entwicklung umfangreicher Multimedia-Anwendungen unentbehrlich. Für diesen Aufgabenbereich müssen allerdings Festplatten deutlich höherer Kapazität (Gigabytebereich) eingesetzt werden.

Für den Transfer und die Distribution multimedialer Dokumente sind Festplatten jedoch wenig geeignet, da sie bei entsprechender Kapazität nicht nur sehr teuer, sondern auch voluminös und unhandlich sind.

Magnetooptische Datenträger

Handlicher als Festplatten sind magnetooptische (MO) Datenträger. Gebräuchliche MO-Laufwerke arbeiten mit auswechselbaren, zweiseitig beschreibbaren Platten im 5,25 oder 3,5 Zoll-Format. Auf eine Platte können abhängig vom Hersteller mehrere hundert MByte Daten geschrieben werden. Beim Schreibvorgang wirken ein Magnetfeld und ein Laserstrahl zusammen. Ein relativ starker Laserstrahl erhitzt das Medium über die sogenannte Curie-Temperatur hinaus, oberhalb der es von einem Magnetfeld beeinflusst in zwei verschiedene Richtungen magnetisiert werden kann. Zum Lesen der Daten genügt allein ein schwächerer Laserstrahl, der die Oberfläche des Mediums berührungsfrei abtastet und je nach Magnetisierung der Oberfläche verschieden reflektiert wird (Kerr-Effekt). Im abgekühlten Zustand sind die Daten auf einer MO-Disk völlig unempfindlich gegen externe Magnetfelder. MO-Platten eignen sich deshalb für die Archivierung von Daten deutlich besser als Disketten oder Festplatten. Auch können MO-Platten beliebig oft neu beschrieben werden. Allerdings dauert der Schreibvorgang wesentlich länger als der Lesevorgang. Da physikalischer Aufbau und Datenaufzeichnungsformat von ISO standardisiert sind, ist die Austauschbarkeit von MO-Platten zwischen den Laufwerken verschiedener Hersteller sichergestellt. Wenn die MO-Laufwerke noch etwas preiswerter und schneller werden, können sie sicher mit den Festplatten konkurrieren. In jedem Fall sind sie im Rahmen von Multimedia-Entwicklungen heute schon dort gefragt, wo große Datenmengen momentan nicht bearbeiteter Projekte ausgelagert werden müssen.

Bild 8: Magnetoopische Laufwerke und magnetooptische Platte (Quelle: Apple)

Die Bildplatte

Zur Wiedergabe längerer Bildfolgen verwenden heute noch viele multimediale Informations- und Verkaufskioske Bildplatten, auch Laserdiscs genannt. Bildplatten sind keine echten Datenträger, da sie nicht beliebige Daten, sondern nur analoge Bild- und digitale Tonfolgen speichern können. Sie können nicht direkt vom PC beschrieben, sondern müssen in einem industriellen Fertigungsprozess hergestellt werden. Da Mastering und Duplizierung mit einigen tausend Mark zu Buche schlagen, eignet sich die Bildplatte nur für Massenanwendungen. Trotzdem hat die Bildplatte für interaktive Anwendungen, die größere Mengen an Einzelbildern oder längere Bildsequenzen benötigen, eine sehr große Bedeutung, da sie für die Bildspeicherung allen anderen Medien überlegen ist und innerhalb 1,5 bis 3 Sekunden auf jedes einzelne Bild positioniert werden kann. Auf eine Seite der zweiseitig nutzbaren Bildplatte passen etwa 36 Minuten Film inklusive Ton oder etwa 54.000 Einzelbilder in hervorragender Bildqualität.

Bild 9: Bildplattenspieler (Quelle: Philips)

Die CD-ROM

Dieses sehr eng mit der Audio-CD verwandte Speichermedium kann wie die Bildplatte nicht direkt beschrieben werden. Anders als die Bildplatte ist die CD-ROM (Compact Disc Read Only Memory) aber sehr vielseitig nutzbar. CD-ROM-Laufwerke sind deshalb wesentlich weiter verbreitet als Bildplattenspieler und sogar zwingender Bestandteil eines MPC gemäss MPC-Definition (siehe Teil 1).

CD-ROMs sind auch handlicher als übliche Bildplatten mit 30 cm (12 Zoll) Durchmesser. Die Standard CD-ROM misst 12 cm (4 3/4 Zoll) bei einer Stärke von 1,2 mm. Die noch selten anzutreffende Single-CD ist sogar nur 8 cm (3,15 Zoll) groß.

Die Daten werden auf der CD-ROM in 2.352 Byte großen Datenblöcken abgelegt. Hiervon bilden nur 2.048 Byte die eigentliche Information. Die übrigen Bytes werden zur Synchronisation, Blockidentifikation und zur Fehlerkontrolle benötigt. Die Datenblöcke befinden sich auf einer spiralförmig angeordneten Spur mit etwa 20.000 Windungen. Bei einer Spurbreite von 0,6 um und einem Spurabstand von 1,6 um liegt die Speicherdichte einer CD-ROM bei 125.000 Bit pro Quadratmillimeter.

Bild 10: CD-ROM-Datenformat (Quelle: Multikom)

Die Blöcke werden in Minuten, Sekunden und Blocknummern gezählt. Eine CD-ROM enthält 3.600 Sekunden mit je 75 Blöcken, so dass sich eine Datenkapazität von 75 Blöcke * 2.352 Byte * 3.600 Sekunden = 605,62 MByte je CD-ROM ergibt. Zwischenzeitlich gibt es auch schon CD-ROMs mit 74 Minuten Spielzeit, die etwa 680 MByte fassen.

Da die Datenblöcke alle gleich lang sind, befinden sich auf der äußeren Spur, bedingt durch den größeren Radius, mehr Datenblöcke als auf der inneren Spur. Um eine konstante Lesegeschwindigkeit zu erhalten, müssen deshalb unterschiedliche Rotationsgeschwindigkeiten dafür sorgen, dass pro Zeiteinheit immer gleichmäßig viele Daten den Lesekopf passieren. Die Rotationsgeschwindigkeit sinkt daher von der innern zur äußeren Spur von 530 Umdrehungen pro Minute auf 200 UPM. Die ständig notwendigen Geschwindigkeitsanpassungen bei diesem als CLV (Constant Linear Velocity) bezeichneten Verfahren sind mit ein Grund für die relativ grosse mittlere Zugriffsgeschwindigkeit eines CD-ROM-Laufwerks von 200 bis 800 Millisekunden. Ein übliches Festplattenlaufwerk arbeitet nach dem CAV-Aufzeichnungs-/Wiedergabeverfahren (Constant Angular Velocity). Das Medium dreht sich hier immer gleich schnell und auf allen konzentrisch angeordneten Spuren ist die gleiche Menge an Daten abgelegt. Dadurch ist eine bedeutend höhere Datenübertragung möglich, was aber durch eine hohe Platzverschwendung erkauft wird; ist doch auf der längeren äußeren Spur nur die gleiche Datenmenge gespeichert wie auf der inneren. Neuere CD-ROM-Laufwerke unterstützen MultiSpin. MultiSpin-Laufwerke laufen im Datenbetrieb mit doppelter Rotationsgschwindigkeit (400 bis 1.060 UPM); um den CD-ROM-Audio-Standard (Red Book) jedoch einzuhalten, bleibt im Audiobetrieb die Drehzahl unverändert. Die Datentransferrate verdoppelt sich bei MultiSpin auf 306 KByte pro Sekunde, und als Nebeneffekt erreicht man durch Halbierung der Rotationswartezeiten auch noch eine Verminderung der mittleren Zugriffszeit, die sich bei neueren Laufwerken zwischen 150 und 350 Millisekunden bewegt.

Bild 11: Anordnung der Datenblöcke beim CLV-(links) und beim CAV-Verfahren (rechts) (Quelle: Multikom)

Die CD besteht aus drei Schichten - eine Trägerschicht, eine Reflexionsschicht aus Aluminium und eine transparente Schutzschicht. Um Daten von der CD-ROM zu lesen, sendet der Lesekopf sehr feine Laserstrahlen aus, die von der Aluminiumschicht unterschiedlich reflektiert werden. Die Änderung der Reflexion hat seine Ursache in sogenannten Pits und Lands. Pits sind Vertiefungen in der CD-Oberfläche, Lands sind die nicht vertiefte Oberfläche. Beim Übergang von einem Pit zu einem Land und umgekehrt wird das Licht stärker gestreut und eine Eins registriert, alles andere wird als Null interpretiert.

Bild 12: Aufbau und Informationscodierung der CD-ROM (Quelle: Data Becker)

CD-ROM-Laufwerke können als externe oder interne Einheit am Computer betrieben werden. Das Einlegen der CD-ROM geschieht entweder direkt in den Schacht wie bei HiFi-Geräten oder mittels einer speziellen CD-Kassette (Caddy). Der Anschluss an den PC kann auf verschiedene Arten erfolgen, man sollte hier jedoch auf einen SCSI-Anschluss achten.

Die CD-ROM besticht durch ihre hohe Speicherkapazität, ihre Handlichkeit und die Datensicherheit. Die relativ hohen Zugriffszeiten und geringen Datentransferraten stellen sich aufgrund sukzessiver Weiterentwicklungen, immer intelligenteren Zugriffsverfahren und effizienteren Komprimierungsverfahren immer weniger problematisch dar. Der Nachteil der Nichtbeschreibbarkeit wird dann zum Vorteil, wenn Daten vom Benutzer nicht verändert werden dürfen. In jedem Fall bietet die CD-ROM ein preiswertes Medium zur Verteilung großer Datenmengen. Eine Münchner Firma gibt derzeit den Stückpreis einer CD-ROM bei einer Auflage von 5.000 Stück inkl. Kosten für Mastering, Verpackung (Jewel Box), Konfektionierung, Farbbedruckung der CD-ROM und Inlay-Karte mit 3,00 DM an.

Die CD-ROM/XA

Eine Schwäche der klassischen CD-ROM ist, dass diese zwar in unterschiedlichen Bereichen Computerdaten wie auch Töne im Audio-CD-Format enthalten kann, dass es aber nicht möglich ist, beides gleichzeitig zu nutzen. Während Daten gelesen werden, kann keine Musik wiedergegeben werden und umgekehrt. Dies ist gerade für Multimedia-Anwendungen eine sehr bedauerliche Einschränkung, da man sonst zum Beispiel sehr einfach den Sound einer multimedialen Präsentation in den Audioteil der CD-ROM verlagern könnte und eine gute Tonqualität im PC auch ohne zusätzliche Audio-Hardware zu erzielen wäre.

Die CD-ROM/XA bietet hierzu die Lösung. Das XA steht für eXtended Architecture und bezeichnet die Erweiterung von CD-ROM um ADPCM, dem leistungsfähigen Audioformat von CD-I (CD-Interactive und andere auf CD-ROM basierende Technologien werden in einem der nächsten Teile dieser Serie genauer erläutert). CD-ROM/XA ist kein neuer Standard, sondern lediglich eine Anwendungserweiterung des Yellow Book (CD-ROM-Spezifikation) um Elemente aus dem Green Book (CD-I Spezifikation) unter Beachtung der Konsistenz zum ISO 9660-Standard (Verzeichnis und File-Struktur-Spezifikation von CD-ROM). Das erstmals 1988 von Philips, Sony und Microsoft angekündigte XA-Format soll in drei Schritten eingeführt werden. Das erste vorläufige Release enthält die oben gewünschte Spezifikation für die ineinander verschachtelte Speicherung von Audio und Daten (interleaved files). Die zweite Version soll Standardformate für Still-Video und Grafik beinhalten. Die endgültige Version soll dann mit zusätzlichen Format-Spezifikationen für Full Motion Video (FMV) ausgestattet sein und somit das parallele Auslesen von Bewegtbild und Ton erlauben. Ein XA-Laufwerk ist in der Lage Photo-CDs zu lesen.

Die Photo-CD

Mit der Photo-CD stellte Kodak 1992 auf der Photokina ein völlig neues Verfahren zur Speicherung und Archivierung herkömmlicher Photos vor. Bis zu 100 Bilder können auf einer der goldenen Scheiben archiviert werden. Jedes Bild wird in fünf verschiedenen Auflösungen auf der PCD gespeichert, vom daumennagelgroßen Minibild (Base/16, 128 * 192 Bildpunkte) für schnelle Übersichten über das HDTV-Format (High Definition TeleVision - 4Base, 1.024 * 1.536 Bildpunkte) bis hin zur für Druckzwecke geeigneten 16Base-Auflösung mit 2.048 * 3.072 Bildpunkten. Dabei merkt sich die PCD für höherauflösende Bilder nicht die vollständige Bildinformation, sondern nur die Differenzen zum Bild mit der jeweils höheren Auflösung (Residuals) - immerhin müssen für eine 16Base-Qualität über 18 MByte eingescannt werden. Die Gesamtkosten für das Einscannen eines Bilds ist stark abhängig von der Anzahl der Bilder, die in einem Rutsch auf die PCD übertragen werden sollen, da schon der CD-Rohling alleine zwischen 15 und 22 DM kostet. Was für den Fotoamateur noch recht teuer ist, kann für den Multimedia-Anwender bereits lohnend sein, da er mit geeigneter Software (z.B. Photo Edge von Kodak) sogar in der Lage ist, die eingescannten Bilder am MPC zu bearbeiten und die Bilder mehrmals, auch in verschiedenen Ausschnittsgrößen, nutzen kann.

Eine PCD kann auch in mehreren Sitzungen bespielt werden. Dann muss das CD-ROM-Laufwerk jedoch multisession-fähig sein. Da die Daten einer PCD nicht veränderbar sind, muss bei jeder Session ein zusätzliches Dateiverzeichnis angelegt werden. Single-Session-Laufwerke finden nur die Daten der ersten Sitzung, multisession-fähige Laufwerke können dagegen die ganze PCD lesen.

Weitere Varianten der PCD sind bereits angekündigt. So soll beispielsweise eine Profi-Version der PCD kommen, die auch 64Base (4.096 * 6.144 Bildpunkte) unterstützt oder eine Portofolio Disc, die bis zu 800 Bilder in Base-Qualität oder bis zu einer Stunde Ton, beides auch gemischt, enthalten kann.

Zum Abschluss dieses Themas sein noch bemerkt, dass man sich, wenn man die CD-ROM-Technik intensiver nutzen will, seinen eigenen CD-Writer kaufen kann, um einmal beschreibbare CDs (WORM - Write Once Read Many) zu erstellen. Die Anschaffung dieses noch relativ teueren Geräts lohnt dann, wenn die CD-ROM zur Archivierung sehr grosser Datenmengen genutzt werden soll, oder wenn man selbst Multimedia-Anwendungen auf CD-ROM entwickeln will. Dann sollte man nämlich die Möglichkeit haben, eigene Testpressungen zu erstellen, bevor die CD-ROM in Serie geht.

Bild 13: Die Photo-CD (Quelle: Kodak)

Bild 14: Mit dem PCD Writer 200 bietet Kodak ein Gerät an, mit dem der Kunde seine CDs auch selbst herstellen kann (Quelle: Kodak)

Der nächste Teil dieser Serie zeigt die für Multimedia gebräuchlichen Ein- und Ausgabegeräte und beschäftigt sich mit der Bildverarbeitung am Computer.

- Fortsetzung folgt -

Literatur

  • Jürgen Buck, Hilfreicher Verlust - Der JPEG-Algorithmus, mc 6/93, Seiten 94 - 101
  • JPEG - Grosse Bilder ganz klein, Multimedia Pro 1/93, Seiten 24 - 28
  • Klaus D. Klingberg (Hrsg.), ABC der Multimedia-Technologie, Multikom-Verlags GmbH, Bergheim, 1993
  • Harald Frater, Dirk Paulissen, Das grosse Buch  zu Multimedia, Data Becker, 1993
  • Joachim Graf, Daniel Treplin, Multimedia-Handbuch, HighText Verlag, 1993
  • Multimedia mit dem Apple-Macintosh, Vorsprung durch Medienintegration, Broschüre von Apple Computer

 

Autor

Der Autor Dipl. Inform. Klaus Eppele ist Inhaber der Firma improve marketing-training-consulting, Karlsruhe, www.improve-mtc.de.

improve
marketing-training-consulting
Dipl. Inform. Klaus Eppele
Heinrich-Weitz-Str. 31
76228 Karlsruhe
Tel: 07 21 / 94 74 6-21
Fax: 07 21 / 94 74 6-22
eMail:
eppele@improve-mtc.de
URL:
http://www.improve-mtc

Erschienen in Datacom 08/93, Seite 74 - 80