Bereits bei der Besprechung des ADPCM-Kompressions-Verfahrens war deutlich geworden, dass in Multimedia-Anwendungen oft riesige Datenmengen zu verwalten sind (z.B. für Stereo-Sound 176,4 KByte pro Sekunde).
In dieser Folge wird diese Problematik vertieft. Zum einen wird am Beispiel JPEG die Kompression von Bilddaten erläutert, zum anderen werden verschiedene Speichermedien auf ihre Multimedia-Tauglichkeit untersucht, wobei
der Schwerpunkt auf Compact Discs gelegt wird.
Ein Bild sagt mehr als tausend Worte
Multimedia wird erst interessant durch hochauflösende Grafiken, Animationen und Bewegtbild. Problematisch ist
hierbei, dass so immense Datenmengen anfallen, dass manche Computer schnell überfordert sind. Beispielsweise werden bei voller Ausnutzung der Auflösung eines üblichen 14-Zoll-Monitors mit 1.024 * 768 Pixeln zur
Speicherung eines Bildschirminhalts mit 24 Bit Farbtiefe (True Color) bereits 2,359 MByte benötigt. Bei der Digitalisieung von Bewegtbild unter Berücksichtigung des CCIR.601-Standards (internationaler Standard für die
digitale Codierung von Komponentenfarbfernsehen) ergibt sich für eine Videosequenz von einer Sekunde sogar ein Speicherplatzbedarf von 20,736 MByte.
Die Lösung sind moderne Kompressionsalgorithmen, die die Datenmengen
reduzieren, ohne dass man einen erheblichen Qualitätsverlust wahrnimmt.
Hilfreicher Verlust durch JPEG
Schon 1988 hat sich die Joint Photographic Expert Group (JPEG) zusammengetan, um erstmals
weltweit einen Kompressionsstandard für Standbilder zu etablieren. Der bereits von der ISO genormte JPEG-Standard hat sich schnell druchgesetzt und wird mittlerweile von nahezu allen Hard- und Softwareherstellern für
die Standbildverarbeitung eingesetzt. Er wird im folgenden beschrieben:
Das 8 * 8 Blockformat
Ausgangspunkt für die Kompression ist ein vom Monitor zeilenweise abgetastetes Bild, das durch die
Farbanteile für Rot, Grün und Blau (RGB) dargestellt wird. Die Intensität jeder Farbe wird mit einer Auflösung von acht Bit digitalisiert, so dass je Bildpunkt 24 Bit benötigt werden. Für die Bearbeitung mit JPEG wird
die Zeilendarstellung in ein Blockformat von je 8 * 8 Bildpunkten für jede der Farben Rot, Grün und Blau umgesetzt. Bei voller Ausnutzung der Auflösung eines 14 Zoll-Monitors mit 1.024 * 768 Bildpunkten und einem
Pixelabstand von 0,28 Millimetern haben die Blöcke eine Kantenlänge von 2,24 Millimetern.
Bild 1: Die Helligkeit und Farbe mit der die einzelnen Bildpunkte oder Pixel (Picture Elements) leuchten wird durch das
RGB-Signal bestimmt. Für JPEG wird das Gesamtbild in Blöcke zu 8 * 8 Pixel zerlegt. Je Block wird eine Matrix für Rot-, Grün- und Blau-Information benötigt. (Quelle: mc)
Änderung des Farbmodells
Obwohl das zu verwendende Farbmodell nicht Gegenstand der JPEG-Norm ist, werden die besten Ergebnisse erzielt, wenn das vom Farbfernsehen bekannte YUV-Modell gewählt wird. Bei diesem Modell wird für jeden Bildpunkt die
Helligkeit Y (Luminanz) sowie Farbton U und Farbsättigung V (Chrominanz) gespeichert. Das YUV-Format wird verwendet, da die hier gespeicherten Werte der Wahrnehmungsfähigkeit des menschlichen Auges besser entsprechen.
Das menschliche Auge kann örtliche Helligkeitsunterschiede sehr viel besser auflösen und unterscheiden als Farbänderungen, so dass die voneinander unabhängigen Y- und UV-Werte mit unterschiedlichem
Kompressionsverhältnis reduziert werden können. Hinzu kommt, dass Bildregionen mit gleicher Helligkeit oder gleicher Farbsättigung wesentlich häufiger sind als Bildregionen mit gleichen Anteilen an Rot, Grün und Blau.
Im YUV-Format haben daher weite Strecken der Pixeldaten, insbesondere für die Helligkeit, gleiche oder ähnliche Werte. Solche Strecken lassen sich wesentlich stärker komprimieren, als Daten, in denen sehr viele
verschiedenen Werte vorkommen.
Bild 2: Der Zusammenhang zwischen U und V geht aus dem Farbdiagramm hervor. (Quelle: mc)
Die Transformation von RGB nach YUV erfolgt durch eine einfache Matrizenmultiplikation. Die
YUV-Komponenten ergeben sich als gewichtete Summe aus den RGB-Komponenten (Y = 0,299 * R + 0,587 * G + 0,114 * B, U = - 0,169 * R - 0,3316 * G + 0,500 * B, V = 0,500 * R - 0,4186 * G - 0,0813 * B). Bei dieser
Transformation wird der Wahrnehmungsfähigkeit des menschlichen Auges Rechnung getragen. So wird beispielsweise wegen der höheren Empfindlichkeit des menschlichen Auges für Grün bei der Berechnung des Y-Wertes die
Grünkomponente am stärksten berücksichtigt (Faktor 0,587).
Bild 3: Transformation von RGB nach YUV mittels Matrizenmultiplikation. (Quelle: mc)
Subsampling
Vor dem eigentlichen JPEG-Prozess kann
nun die erste Datenreduktion vorgenommen werden. Da das Auge nicht so viele Farbdetails wie Helligkeitsdetails unterscheiden kann, ist es nicht notwendig, beide mit derselben Genauigkeit abzutasten. Anstatt YUV im
Verhältnis 4:4:4 abzutasten, kann ein Subsampling (Unterabtastung) von 4:2:2 gewählt werden. Der Kompressionsgewinn hierdurch beträgt 3:2.
Die Diskrete Cosinus Transformation DCT
Der erste Schritt
des eigentlichen JPEG-Algorithmus ist die Diskrete Cosinus Transformation, die einer Fouriertransformation sehr ähnlich ist. Sowohl für den Helligkeits- als auch für den Farbverlauf innerhalb eines jeden 8 * 8 Blocks
gilt, dass jeder Funktionsverlauf mit beliebigen Werten f(x,y) mit x,y = 0 bis 7 durch šberlagerung der 64 Grundfunktionen (G) der Diskreten Cosinus Transformation G(u,v) = (cos((2x+1)u*pi/16)*cos((2y+1)v*pi/16)), mit
u,v = 0 bis 7 dargestellt werden kann in der Form f(x,y) = 1/4 (C(0,0)/2*G(0,0) + C(0,1)*G(0,1) + ... + C(7,7)*G(7,7)). Der Anteil der einzelnen Grundfunktionen an der Gesamtfunktion wird durch die Vorfaktoren C(u,v)
bestimmt. Diese Vorfaktoren werden auch als DCT-Koeffizienten bezeichnet. Für Ihre Berechnung dient die FDCT (Forward DCT) in Bild 4. Die DCT-Koeffizienten geben an, wie gross der Anteil einer Funktion an der
Bildinformation ist und sortieren die Gesamtinformation nach verschiedenen Frequenzen.
Bild 4: Die Formeln für die Diskrete Cosinus Transformation, wie sie bei JPEG verwendet werden
Man erhält je 8*8-Block drei
Matrizen mit DCT-Koeffizienten. In jeder Matrix steht links oben der DC-Koeffizient (Gleichanteil), nach rechts und nach unten hin stehen die sogenannten AC-Koeffizienten der höherfrequenten Grundfunktionen. Durch
Analysieren vieler Bilder konnte man feststellen, dass sich die Bildinformation im wesentlichen in den Koeffizienten in der linken oberen Ecke jeder Matrix konzentriert. Die höherfrequenten Grundfunktionen tragen kaum
oder gar keine Information, so dass die zugehörigen Koeffizienten in der Matrix meist Null sind.
Sieht man von der Rechenungenauigkeit bei Matrizenmultiplikation und DCT ab, so ist bis auf das optionale Subsampling,
das für das menschliche Sehvermögen unwesentlich ist, das Verfahren bisher nicht verlustbehaftet und umkehrbar. Allerdings hat man bis auf das Subsampling bisher auch keine Reduzierung der Daten erreicht, sondern diese
nur für eine Kompression optimiert.
Bild 5: Beispiel für die zweidimensionale DCT. Dargestellt ist ein Übergang von hell nach dunkel. Die erste Matrix zeigt die 64 Luminanzwerte. Die zweite Matrix enthält die
DCT-Koeffizienten, die fast alle Null sind. (Quelle: mc)
Die Quantisierung
Die Quantisierung ist der eigentliche verlustbehaftete Prozess beim JPEG-Algorithmus. DCT-Koeffizienten, die sich nicht
wesentlich voneinander unterscheiden, werden zu einem Wert zusammengefasst. Dies geschieht, indem man alle Matrizenwerte durch eine vorgegebene Schrittweite dividiert. Neben der Verkleinerung des Wertebereiches erreicht
man hiermit, dass noch weitere Koeffizienten höherfrequenter Funktionen zu Null werden. Die Art der Quantisierung ist von JPEG nicht vorgeschrieben. Oft erfolgt die Quantisierung mit Hilfe sogenannter psychovisueller
Gewichtsfunktionen. Diese berücksichtigen die Farb- und Helligkeitsempfindlichkeiten des menschlichen Auges und sehen für unterschiedliche Frequenzen unterschiedliche Quantisierungsschrittweiten vor. Erlaubt ist auch,
dass der Anwender selbst in den Vorgang der Quantisierung eingreifen kann. Durch Wahl der Quantisierungsschritte kann er so sein Optimum für das Verhältnis Speicherplatz / Bildqualität finden.
Der Zick-Zack-Kurs
Nach der Quantisierung wird der DC-Anteil getrennt von den AC-Teilen behandelt. Weil zwischen den DC-Koeffizienten benachbarter 8*8-Blöcke eine hohe Korrelation herrscht, werden diese nur als
Differenz zum vorhergehenden Block codiert. Die AC-Koeffizienten werden in einem Zick-Zack-Kurs aufgereiht. Durch diese Abtastung der Matrix erreicht man, dass die Null-Werte zu zusammenhängenden Abschnitten
zusammengefasst werden.
Bild 6: Zick-Zack-Abtastung der Matrizen. (Quelle: mc)
Lauflängen- und Huffmann-Codierung
Bei der anschließenden Lauflängen-Codierung werden aufeinanderfolgende gleiche
Werte zu Datenblöcken zusammengefasst. In einem Datenblock wird nur der Wert und dessen Häufigkeit gespeichert. Die aufwendige Abbildung der ursprünglichen Bildinformationen in Folgen von Werten mit großen
Nullwertbereichen macht sich jetzt bezahlt.
Im letzten Schritt erfolgt die Huffmann-Codierung. Selten auftretenden Werten werden längere Codeworte zugeordnet als häufig auftretenden Werten. In einem ersten Durchlauf
werden die Daten statistisch ausgewertet. Es wird abgezählt, wie häufig bestimmte Werte auftreten. Erst dann wird der optimale Huffmann-Code ermittelt, der zur Codierung herangezogen wird. Die Codeworte werden dabei so
gewählt, dass kein Code als Substring am Beginn eines anderen auftritt. Man kann deshalb die Codeworte ohne Trennzeichen hintereinander aufreihen.
Lauflängen- und Huffmann-Codierung sind verlustfreie Prozesse. Von
JPEG wird kein spezieller Huffmann-Code vorgegeben. Dies ist sinnvoll, da man somit zum einen die Freiheit hat, über die Wahl des Codes die Qualität des Bildes selbst zu bestimmen, und zum anderen für unterschiedliche
Bildvorlagen unterschiedliche Huffmann-Codes verwenden kann, um das Optimum bei der Kompression zu erzielen.
Die Qualität von JPEG
Ohne Quantisierung erreicht die JPEG-Kompression einen Faktor von
etwa 20:1. Bis zu diesem Grad sind Qualitätsverluste für das menschliche Auge noch nicht erkennbar, so dass hier auch von överlustfreiem JPEGö gesprochen wird. Abhängig vom Originalbild werden jedoch Qualitätsverluste
bei grösseren Kompressionsraten sichtbar. Bis zu einem Kompressionsfaktor 60:1 bleibt die Bildqualität für die meisten Anwendungen ausreichend. Darüber hinaus reagiert man meist sehr empfindlich auf die entstehenden
Farb- und Helligkeitsabstufungen.
Bild 7: Beispiel für die Qualität JPEG-komprimierter Bilder: Oben: Originalbild, Mitte: Reduzierung der Bilddaten um 50 Prozent, Unten: die komprimierten Daten betragen hier nur noch
5 Prozent der ursprünglichen Datenmenge. (Quelle: mc)
JPEG-Video / Moving JPEG
JPEG-Algorithmen sind als Software- oder Hardwarelösungen von verschiedenen Anbietern erhältlich. JPEG-Chips sind
heute bereits so schnell, dass sie bis zu 40 Bilder pro Sekunde komprimieren und dekomprimieren können und somit auch zum Speichern und Abspielen von digitalem Video herangezogen werden können (die gängigen
Fernsehnormen PAL (Phase Alternating Line) und NTSC (National Television System Committee) setzen nur 25 bzw. 30 Bilder pro Sekunde voraus). Bei einer Kompressionsrate von 60:1 pro Einzelbild erreicht JPEG noch
Fernsehqualität. Statt den ursprünglichen 20,736 MByte müssen dann vom Computer nur noch knapp 350 KByte verarbeitet werden, was für die Übertragungskapazität von CD-Laufwerken oder manchen lokalen Netzwerken aber noch
immer zu viel ist.
MPEG - der Standard für Bewegtbild
Auch MPEG (Motion Picture Experts Group) ist von CCITT und ISO abgesegnet. Während JPEG auf die Komprimierung von Einzelbildern optimiert ist,
soll MPEG redundante Daten in Folgen von Einzelbildern erkennen und beseitigen. Dabei macht sich MPEG die Tatsache zunutze, dass sich aufeinanderfolgende Bilder einer Filmsequenz meist nicht stark voneinander
unterscheiden. In sogenannten Predicted-Frames merkt sich MPEG deshalb nur die Pixelveränderungen zum vorhergehenden Bild. Als Aufsetzpunkte innerhalb einer Bildsequenz dienen die Intra-Frames, die so gespeichert
werden, dass die gesamte Bildinformation wiedergewonnen werden kann. Vorteil von diesem Verfahren ist, dass MPEG einen Kompressionsfaktor von 160:1 erreichen kann und somit mit etwa 125 KByte pro Sekunde Video auskommt.
Damit liegt man unter der Übertragungsrate von 150 KByte herkömmlicher CD-ROM-Laufwerke und kann MPEG-komprimiertes Video von CD-ROM abspielen. MPEG hat aber auch Nachteile gegenüber Moving JPEG. Gegenüber JPEG handelt
es sich nämlich bei MPEG um ein asymmetrisches Verfahren. Die Kompression ist viel rechenaufwendiger als die Dekompression. Dies führt dazu, dass MPEG im breiten Markt vorerst nur als reine Wiedergabetechnik Verwendung
findet und zur Komprimierung teuere Zusatzhardware eingesetzt werden muss. Außerdem können mit MPEG komprimierte Videos nicht rückwärts abgespielt und nicht immer Frame-genau positioniert werden. Dies erschwert die
Weiterverarbeitung von MPEG-Videos. Trotzdem stellt MPEG derzeit den Standardalgorithmus für Videokomprimierung dar. Für Ende 1993 ist auch schon die Weiterentwicklung MPEG 2 angesagt, die eine höhere Bildauflösung
unterstützen wird.
Speichermedien für multimediale Anwendungen
Auch mit Komprimierungsverfahren fallen bei multimedialen Anwendungen, speziell bei der Nutzung von Realbild- und Tonfolgen, enorm
große Datenmengen an. Beispielsweise braucht eine Stunde Moving JPEG immer noch fast 1,3 GByte Speicherplatz. Dadurch wird die Frage nach geeigneten Datenträgern bzw. Speichermedien aufgeworfen. Datenträger, die als
Auslieferungsmedium für multimediale Dokumente dienen sollen, müssen mehrere MByte Kapazität bieten sowie preiswert und leicht zu bedienen sein.
Magnetische Datenträger
Die ältesten und gebräuchlichsten
Datenträger im PC-Bereich, Disketten und Festplatten, verwenden rein magnetische Aufzeichnungsverfahren. Diese Technologie ist bewährt und liefert verhältnismäßig preiswerte und zuverlässige Speichermedien. Speziell
Festplatten sind zudem auch ein ausgesprochen schnelles Speichermedium. Das betrifft nicht nur die Zugriffszeit - jeder Datensatz auf einer Festplatte kann in wenigen Millisekunden gelesen oder geschrieben werden -
sondern auch die Übertragungsraten. Moderne Festplatten bieten eine Zugriffszeit nahe 10 Millisekunden und können, abhängig vom Übertragungsverfahren und vom Anschluss, zwischen 0,25 und 10 MByte Daten pro Sekunden
aufzeichnen und wiedergeben.
Während Disketten aufgrund der geringen Kapazität von lediglich 0,7 bis 1,5 MByte als Multimedia-Speichermedium völlig ungeeignet sind, reichen heute übliche Festplatten für die
Speicherung kürzerer Bild- oder Tonfolgen aus. Schnelle Festplatten sind zudem bei der Entwicklung umfangreicher Multimedia-Anwendungen unentbehrlich. Für diesen Aufgabenbereich müssen allerdings Festplatten deutlich
höherer Kapazität (Gigabytebereich) eingesetzt werden.
Für den Transfer und die Distribution multimedialer Dokumente sind Festplatten jedoch wenig geeignet, da sie bei entsprechender Kapazität nicht nur sehr teuer,
sondern auch voluminös und unhandlich sind.
Magnetooptische Datenträger
Handlicher als Festplatten sind magnetooptische (MO) Datenträger. Gebräuchliche MO-Laufwerke arbeiten mit auswechselbaren, zweiseitig
beschreibbaren Platten im 5,25 oder 3,5 Zoll-Format. Auf eine Platte können abhängig vom Hersteller mehrere hundert MByte Daten geschrieben werden. Beim Schreibvorgang wirken ein Magnetfeld und ein Laserstrahl zusammen.
Ein relativ starker Laserstrahl erhitzt das Medium über die sogenannte Curie-Temperatur hinaus, oberhalb der es von einem Magnetfeld beeinflusst in zwei verschiedene Richtungen magnetisiert werden kann. Zum Lesen der
Daten genügt allein ein schwächerer Laserstrahl, der die Oberfläche des Mediums berührungsfrei abtastet und je nach Magnetisierung der Oberfläche verschieden reflektiert wird (Kerr-Effekt). Im abgekühlten Zustand sind
die Daten auf einer MO-Disk völlig unempfindlich gegen externe Magnetfelder. MO-Platten eignen sich deshalb für die Archivierung von Daten deutlich besser als Disketten oder Festplatten. Auch können MO-Platten beliebig
oft neu beschrieben werden. Allerdings dauert der Schreibvorgang wesentlich länger als der Lesevorgang. Da physikalischer Aufbau und Datenaufzeichnungsformat von ISO standardisiert sind, ist die Austauschbarkeit von
MO-Platten zwischen den Laufwerken verschiedener Hersteller sichergestellt. Wenn die MO-Laufwerke noch etwas preiswerter und schneller werden, können sie sicher mit den Festplatten konkurrieren. In jedem Fall sind sie
im Rahmen von Multimedia-Entwicklungen heute schon dort gefragt, wo große Datenmengen momentan nicht bearbeiteter Projekte ausgelagert werden müssen.
Bild 8: Magnetoopische Laufwerke und magnetooptische Platte (Quelle: Apple)
Die Bildplatte
Zur Wiedergabe längerer Bildfolgen verwenden heute noch viele multimediale Informations- und
Verkaufskioske Bildplatten, auch Laserdiscs genannt. Bildplatten sind keine echten Datenträger, da sie nicht beliebige Daten, sondern nur analoge Bild- und digitale Tonfolgen speichern können. Sie können nicht direkt
vom PC beschrieben, sondern müssen in einem industriellen Fertigungsprozess hergestellt werden. Da Mastering und Duplizierung mit einigen tausend Mark zu Buche schlagen, eignet sich die Bildplatte nur für
Massenanwendungen. Trotzdem hat die Bildplatte für interaktive Anwendungen, die größere Mengen an Einzelbildern oder längere Bildsequenzen benötigen, eine sehr große Bedeutung, da sie für die Bildspeicherung allen
anderen Medien überlegen ist und innerhalb 1,5 bis 3 Sekunden auf jedes einzelne Bild positioniert werden kann. Auf eine Seite der zweiseitig nutzbaren Bildplatte passen etwa 36 Minuten Film inklusive Ton oder etwa
54.000 Einzelbilder in hervorragender Bildqualität.
Bild 9: Bildplattenspieler (Quelle: Philips)
Die CD-ROM
Dieses sehr eng mit der Audio-CD verwandte Speichermedium kann wie die Bildplatte nicht
direkt beschrieben werden. Anders als die Bildplatte ist die CD-ROM (Compact Disc Read Only Memory) aber sehr vielseitig nutzbar. CD-ROM-Laufwerke sind deshalb wesentlich weiter verbreitet als Bildplattenspieler und
sogar zwingender Bestandteil eines MPC gemäss MPC-Definition (siehe Teil 1).
CD-ROMs sind auch handlicher als übliche Bildplatten mit 30 cm (12 Zoll) Durchmesser. Die Standard CD-ROM misst 12 cm (4 3/4 Zoll) bei einer
Stärke von 1,2 mm. Die noch selten anzutreffende Single-CD ist sogar nur 8 cm (3,15 Zoll) groß.
Die Daten werden auf der CD-ROM in 2.352 Byte großen Datenblöcken abgelegt. Hiervon bilden nur 2.048 Byte die eigentliche
Information. Die übrigen Bytes werden zur Synchronisation, Blockidentifikation und zur Fehlerkontrolle benötigt. Die Datenblöcke befinden sich auf einer spiralförmig angeordneten Spur mit etwa 20.000 Windungen. Bei
einer Spurbreite von 0,6 um und einem Spurabstand von 1,6 um liegt die Speicherdichte einer CD-ROM bei 125.000 Bit pro Quadratmillimeter.
Bild 10: CD-ROM-Datenformat (Quelle: Multikom)
Die Blöcke werden in Minuten,
Sekunden und Blocknummern gezählt. Eine CD-ROM enthält 3.600 Sekunden mit je 75 Blöcken, so dass sich eine Datenkapazität von 75 Blöcke * 2.352 Byte * 3.600 Sekunden = 605,62 MByte je CD-ROM ergibt. Zwischenzeitlich
gibt es auch schon CD-ROMs mit 74 Minuten Spielzeit, die etwa 680 MByte fassen.
Da die Datenblöcke alle gleich lang sind, befinden sich auf der äußeren Spur, bedingt durch den größeren Radius, mehr Datenblöcke als auf
der inneren Spur. Um eine konstante Lesegeschwindigkeit zu erhalten, müssen deshalb unterschiedliche Rotationsgeschwindigkeiten dafür sorgen, dass pro Zeiteinheit immer gleichmäßig viele Daten den Lesekopf passieren.
Die Rotationsgeschwindigkeit sinkt daher von der innern zur äußeren Spur von 530 Umdrehungen pro Minute auf 200 UPM. Die ständig notwendigen Geschwindigkeitsanpassungen bei diesem als CLV (Constant Linear Velocity)
bezeichneten Verfahren sind mit ein Grund für die relativ grosse mittlere Zugriffsgeschwindigkeit eines CD-ROM-Laufwerks von 200 bis 800 Millisekunden. Ein übliches Festplattenlaufwerk arbeitet nach dem
CAV-Aufzeichnungs-/Wiedergabeverfahren (Constant Angular Velocity). Das Medium dreht sich hier immer gleich schnell und auf allen konzentrisch angeordneten Spuren ist die gleiche Menge an Daten abgelegt. Dadurch ist
eine bedeutend höhere Datenübertragung möglich, was aber durch eine hohe Platzverschwendung erkauft wird; ist doch auf der längeren äußeren Spur nur die gleiche Datenmenge gespeichert wie auf der inneren. Neuere
CD-ROM-Laufwerke unterstützen MultiSpin. MultiSpin-Laufwerke laufen im Datenbetrieb mit doppelter Rotationsgschwindigkeit (400 bis 1.060 UPM); um den CD-ROM-Audio-Standard (Red Book) jedoch einzuhalten, bleibt im
Audiobetrieb die Drehzahl unverändert. Die Datentransferrate verdoppelt sich bei MultiSpin auf 306 KByte pro Sekunde, und als Nebeneffekt erreicht man durch Halbierung der Rotationswartezeiten auch noch eine
Verminderung der mittleren Zugriffszeit, die sich bei neueren Laufwerken zwischen 150 und 350 Millisekunden bewegt.
Bild 11: Anordnung der Datenblöcke beim CLV-(links) und beim CAV-Verfahren (rechts) (Quelle: Multikom)
Die CD besteht aus drei Schichten - eine Trägerschicht, eine Reflexionsschicht aus Aluminium und eine transparente Schutzschicht. Um Daten von der CD-ROM zu lesen, sendet der Lesekopf sehr feine Laserstrahlen aus,
die von der Aluminiumschicht unterschiedlich reflektiert werden. Die Änderung der Reflexion hat seine Ursache in sogenannten Pits und Lands. Pits sind Vertiefungen in der CD-Oberfläche, Lands sind die nicht vertiefte
Oberfläche. Beim Übergang von einem Pit zu einem Land und umgekehrt wird das Licht stärker gestreut und eine Eins registriert, alles andere wird als Null interpretiert.
Bild 12: Aufbau und Informationscodierung der CD-ROM (Quelle: Data Becker)
CD-ROM-Laufwerke können als externe oder interne Einheit am Computer betrieben werden. Das Einlegen der CD-ROM geschieht entweder direkt in
den Schacht wie bei HiFi-Geräten oder mittels einer speziellen CD-Kassette (Caddy). Der Anschluss an den PC kann auf verschiedene Arten erfolgen, man sollte hier jedoch auf einen SCSI-Anschluss achten.
Die CD-ROM
besticht durch ihre hohe Speicherkapazität, ihre Handlichkeit und die Datensicherheit. Die relativ hohen Zugriffszeiten und geringen Datentransferraten stellen sich aufgrund sukzessiver Weiterentwicklungen, immer
intelligenteren Zugriffsverfahren und effizienteren Komprimierungsverfahren immer weniger problematisch dar. Der Nachteil der Nichtbeschreibbarkeit wird dann zum Vorteil, wenn Daten vom Benutzer nicht verändert werden
dürfen. In jedem Fall bietet die CD-ROM ein preiswertes Medium zur Verteilung großer Datenmengen. Eine Münchner Firma gibt derzeit den Stückpreis einer CD-ROM bei einer Auflage von 5.000 Stück inkl. Kosten für
Mastering, Verpackung (Jewel Box), Konfektionierung, Farbbedruckung der CD-ROM und Inlay-Karte mit 3,00 DM an.
Die CD-ROM/XA
Eine Schwäche der klassischen CD-ROM ist, dass diese zwar in
unterschiedlichen Bereichen Computerdaten wie auch Töne im Audio-CD-Format enthalten kann, dass es aber nicht möglich ist, beides gleichzeitig zu nutzen. Während Daten gelesen werden, kann keine Musik wiedergegeben
werden und umgekehrt. Dies ist gerade für Multimedia-Anwendungen eine sehr bedauerliche Einschränkung, da man sonst zum Beispiel sehr einfach den Sound einer multimedialen Präsentation in den Audioteil der CD-ROM
verlagern könnte und eine gute Tonqualität im PC auch ohne zusätzliche Audio-Hardware zu erzielen wäre.
Die CD-ROM/XA bietet hierzu die Lösung. Das XA steht für eXtended Architecture und bezeichnet die Erweiterung von
CD-ROM um ADPCM, dem leistungsfähigen Audioformat von CD-I (CD-Interactive und andere auf CD-ROM basierende Technologien werden in einem der nächsten Teile dieser Serie genauer erläutert). CD-ROM/XA ist kein neuer
Standard, sondern lediglich eine Anwendungserweiterung des Yellow Book (CD-ROM-Spezifikation) um Elemente aus dem Green Book (CD-I Spezifikation) unter Beachtung der Konsistenz zum ISO 9660-Standard (Verzeichnis und
File-Struktur-Spezifikation von CD-ROM). Das erstmals 1988 von Philips, Sony und Microsoft angekündigte XA-Format soll in drei Schritten eingeführt werden. Das erste vorläufige Release enthält die oben gewünschte
Spezifikation für die ineinander verschachtelte Speicherung von Audio und Daten (interleaved files). Die zweite Version soll Standardformate für Still-Video und Grafik beinhalten. Die endgültige Version soll dann mit
zusätzlichen Format-Spezifikationen für Full Motion Video (FMV) ausgestattet sein und somit das parallele Auslesen von Bewegtbild und Ton erlauben. Ein XA-Laufwerk ist in der Lage Photo-CDs zu lesen.
Die Photo-CD
Mit der Photo-CD stellte Kodak 1992 auf der Photokina ein völlig neues Verfahren zur Speicherung und Archivierung herkömmlicher Photos vor. Bis zu 100 Bilder können auf einer der goldenen Scheiben
archiviert werden. Jedes Bild wird in fünf verschiedenen Auflösungen auf der PCD gespeichert, vom daumennagelgroßen Minibild (Base/16, 128 * 192 Bildpunkte) für schnelle Übersichten über das HDTV-Format (High Definition
TeleVision - 4Base, 1.024 * 1.536 Bildpunkte) bis hin zur für Druckzwecke geeigneten 16Base-Auflösung mit 2.048 * 3.072 Bildpunkten. Dabei merkt sich die PCD für höherauflösende Bilder nicht die vollständige
Bildinformation, sondern nur die Differenzen zum Bild mit der jeweils höheren Auflösung (Residuals) - immerhin müssen für eine 16Base-Qualität über 18 MByte eingescannt werden. Die Gesamtkosten für das Einscannen eines
Bilds ist stark abhängig von der Anzahl der Bilder, die in einem Rutsch auf die PCD übertragen werden sollen, da schon der CD-Rohling alleine zwischen 15 und 22 DM kostet. Was für den Fotoamateur noch recht teuer ist,
kann für den Multimedia-Anwender bereits lohnend sein, da er mit geeigneter Software (z.B. Photo Edge von Kodak) sogar in der Lage ist, die eingescannten Bilder am MPC zu bearbeiten und die Bilder mehrmals, auch in
verschiedenen Ausschnittsgrößen, nutzen kann.
Eine PCD kann auch in mehreren Sitzungen bespielt werden. Dann muss das CD-ROM-Laufwerk jedoch multisession-fähig sein. Da die Daten einer PCD nicht veränderbar sind, muss
bei jeder Session ein zusätzliches Dateiverzeichnis angelegt werden. Single-Session-Laufwerke finden nur die Daten der ersten Sitzung, multisession-fähige Laufwerke können dagegen die ganze PCD lesen.
Weitere
Varianten der PCD sind bereits angekündigt. So soll beispielsweise eine Profi-Version der PCD kommen, die auch 64Base (4.096 * 6.144 Bildpunkte) unterstützt oder eine Portofolio Disc, die bis zu 800 Bilder in
Base-Qualität oder bis zu einer Stunde Ton, beides auch gemischt, enthalten kann.
Zum Abschluss dieses Themas sein noch bemerkt, dass man sich, wenn man die CD-ROM-Technik intensiver nutzen will, seinen eigenen
CD-Writer kaufen kann, um einmal beschreibbare CDs (WORM - Write Once Read Many) zu erstellen. Die Anschaffung dieses noch relativ teueren Geräts lohnt dann, wenn die CD-ROM zur Archivierung sehr grosser Datenmengen
genutzt werden soll, oder wenn man selbst Multimedia-Anwendungen auf CD-ROM entwickeln will. Dann sollte man nämlich die Möglichkeit haben, eigene Testpressungen zu erstellen, bevor die CD-ROM in Serie geht.
Bild 13: Die Photo-CD (Quelle: Kodak)
Bild 14: Mit dem PCD Writer 200 bietet Kodak ein Gerät an, mit dem der Kunde seine CDs auch selbst herstellen kann (Quelle: Kodak)
Der nächste Teil dieser Serie zeigt die für
Multimedia gebräuchlichen Ein- und Ausgabegeräte und beschäftigt sich mit der Bildverarbeitung am Computer.
- Fortsetzung folgt -
Literatur
- Jürgen Buck, Hilfreicher Verlust - Der JPEG-Algorithmus, mc 6/93, Seiten 94 - 101
- JPEG - Grosse Bilder ganz klein, Multimedia Pro 1/93, Seiten 24 - 28
- Klaus D. Klingberg (Hrsg.), ABC der Multimedia-Technologie, Multikom-Verlags GmbH, Bergheim, 1993
- Harald Frater, Dirk Paulissen, Das grosse Buch zu Multimedia, Data Becker, 1993
- Joachim Graf, Daniel Treplin, Multimedia-Handbuch, HighText Verlag, 1993
- Multimedia mit dem Apple-Macintosh, Vorsprung durch Medienintegration, Broschüre von Apple Computer