Multimedia ist jedoch kein Produkt, sondern ein Konzept bzw. eine Philosophie, in der der
Personal-Computer oder die Workstation als Integrator unterschiedlicher Medien wie Text, Sprache, Ton, Grafik, Bild, Video und Animation die Hauptrolle spielt. Die Idee von Multimedia ist die Zusammenführung dieser
Medien und verschiedener Techniken zum Zweck moderner Informationsvermittlung, Kommunikation und Unterhaltung. Multimedia ist somit die Vereinigung der heute noch getrennt laufenden vier Industriezweige
Geschäftscomputer, Unterhaltungselektronik, Telekommunikation und Medienunterhaltung.
Mehr Effizienz durch Interaktion
Das wichtigste an Multimedia ist die Einbeziehung des Anwenders.
Erst durch Hinzufügen der Komponenten Interaktion wird Multimedia wirklich interessant und effizient nutzbar. Der Betrachter bzw. der Anwender soll im Mittelpunkt des Geschehens stehen, damit er durch gezielte Eingriffe
den Ablauf und die Art der Informationsvermittlung beeinflussen kann. Auch im Fernsehen gibt es Text, Sprache, Ton, Grafik, Bild, Video und Animation, jedoch erschöpft sich die Aktivität des Benutzers im Drücken der
Fernbedienung. Interessiert er sich für die Ereignisse des Tages, muss er Punkt 20.00 Uhr den Fernseher einschalten und 15 Minuten davor verweilen, um nicht einen Teil der Informationen zu verpassen und auch noch die
Wettervorhersage mitzubekommen. Mit einem interaktiven System könnte er sich eine Übersicht der Tagesgeschehnisse anzeigen lassen und einzelne Beiträge jederzeit in beliebiger Reihenfolge auswählen. Uninteressante
Beiträge könnten gestoppt und wichtige Informationen ein zweites Mal abgerufen werden.
Für die Interaktion spricht auch die Tatsache, dass sich die Merkfähigkeit des Menschen nach der Qualität der
Wahrnehmung staffelt. Je intensiver das Erlebnis, desto einprägsamer ist die vermittelte Information. Der Mensch behält nur etwa 25 Prozent von dem, was er hört, im Erinnerungsvermögen, aber bereits 45 Prozent von dem,
was er sieht und hört. Kommt noch das eigene Tun dazu (die Interaktion), bleiben Längerfristig bis zu 75 Prozent der Tätigkeit im Gedächtnis haften.
Multimediale Anwendungen
Ein weites Feld multimedialer Anwendungen tut sich in den kommenden Jahren auf:
- "Point of Information"- und "Point of Sales"-Systeme (POI/POS) werden zum einen die klassischen Werbe- und Marketingmethoden auf Messen, in Verkaufsräumen mit wenig Personal und in
Fußgängerzonen ergänzen, indem sie bereitwillig rund um die Uhr Auskunft geben (POI) oder gar den Verkauf von Produkten und Dienstleistungen übernehmen (POS). Anwendungsbeispiele hierfür sind die sich rasant
ausbreitenden Bankenterminals, an denen der Kunde sowohl Informationen abholen (z.B. Kontostand) als auch Dienstleistungen in Anspruch nehmen kann (z.B. Einrichten eines Dauerauftrags).
Bild 1: Multimedia und Banken. Bankenterminal der Schweizer Bank Gesellschaft
- Computergestützte Aus- und Weiterbildung (Computer Based Training - CBT) wird die Wissensvermittlung erleichtern: Interaktive Systeme führen zu größerer Akzeptanz und Effizienz. Visualisierung mittels
Animationen gibt die Möglichkeit auch komplizierte Themengebiete einfacher zu erläutern (z.B. Funktionsabläufe im Inneren eines Motors). Spracheingabe erleichtert die Bedienung und ermöglicht beim
Vokabeltraining die Kontrolle der korrekten Aussprache durch das Multimedia-System. Beliebige Duplizierbarkeit und Wiederverwertbarkeit eines fertigen Trainingssystems spart dort Kosten ein, wo ständig neuen
Personen gleichartiges Wissen vermittelt werden muss (z.B. Produktschulung für neue Mitarbeiter).
- Dreidimensionale Animation virtueller Realitäten wird als Planungshilfe dienen (z.B. Betrachten des auf dem Computer entworfenen Messestandes, bevor dieser aufgebaut wird). Sie wird Kosten sparen und Risiken
minimieren (z.B. durch Simulationen im militärischen Bereich oder in der Luftfahrt).
Bild 2: Ein Gebäude, das nur im Entwurf existiert, in seinem späteren Umfeld. Das 3D-Modell aus dem Computer wird in ein eingescanntes Foto eingebaut. Die Illusion ist perfekt.
Alternative zu
Bild 2: Planung eines Messestands mittels Animation. Computer, Zwischenwände und Hocker werden direkt aus der Computer-Bibliothek abgerufen und per Mausklick exakt platziert. Der fertige Messestand lässt sich von allen
Seiten betrachten und begehen. Firmenlogos können importiert und platziert werden.
- Rechnerbasierende Videokonferenzen, Video-E-Mail-Systeme und Videokonferenzsysteme über Rechnernetze werden die Vorteile von Bildtelefonen, Netzwerken und Videokonferenzen bündeln und zu neuen Formen
firmeninterner Kommunikation führen. Mittels "Document Sharing" werden Dokumente und Bildinformationen von mehreren räumlich getrennten Experten zur gleichen Zeit am Bildschirm betrachtet und verändert
werden können, wobei Änderungen des Bildschirminhalts sofort für alle Beteiligten sichtbar sein werden.
Bild 3: "Document Sharing" über WANs (Wide Area Networks). Komplexe Sachverhalte werden zeitgleich mehreren räumlich getrennten Experten mittels hochauflösender Grafiken, Textinformationen,
eingescannten Originalunterlagen und Datenbankinformationen am Bildschirm angezeigt. Über Bildtelefon kann der Sachverhalt diskutiert werden. Annotationen, die von einem der Kommunikationspartner in ein Bild eingefügt
werden, erscheinen zeitgleich auf dem Monitor der anderen.
- Im Bereich der Unterhaltung werden multimediale Techniken den Umgang mit herkömmlichen audiovisuellen Medien revolutionieren (z.B. interaktives Fernsehen oder Audio-CDs mit Anzeige der Liedertexte).
Detaillierte Einblicke in spezielle multimediale Anwendungsbereiche werden in einer späteren Folge dieser Serie gegeben.
Der Markt für Multimedia
Bereits 1991 hat das
Marktforschungsinstitut IDC erste Untersuchungen des deutschen Markts für Multimedia durchgeführt. IDC geht davon aus, dass sich Multimedia zwischen 1993 und 1994 am Markt durchsetzen wird, so dass bereits 1994 für den
professionellen Einsatz im Hardwarebereich über 400 Millionen DM umgesetzt werden. Sinkende Preise sollen 1995 zu einer Umsatzstagnation führen, 1996 soll jedoch der endgültige Durchbruch erfolgen und der Hardwareumsatz
auf über eine Milliarde DM anwachsen.
Bilder 4 und 5: Die Entwicklung des Hardware- und des Software Multimediamarkts für den professionellen Einsatz in Deutschland
Digitales Video wird der
Renner unter den Medien werden. Eine IWG-Untersuchung (IWG = Information Workstation Group) vom September 1992 zeigt, dass 1995 mehr als die Hälfte aller Multimedia-Anwendungen Videosequenzen enthalten werden.
Bild 6: Die Mehrzahl der Multimedia-Anwendungen wird 1995 Videosequenzen enthalten
Interessant ist auch eine Studie des amerikanischen Forschungs- und Analytik-Unternehmens Inteco aus dem Jahre
1990, die besagt, dass der klassische PC bis 1995 den Apple-Macintosh als derzeit führende Multimediaplattform ablösen wird.
Bild 7: Marktanteile der Multimedia-Hardware-Plattformen
Was die
favorisierten Anwendungen betrifft, so kommen mehrere Untersuchungen zu dem gleichen Ergebnis, dass wohl die computerunterstützte Ausbildung das Hauptanwendungsgebiet von Multimedia werden wird. Eine europäische
Marktbefragung von Frost & Sullivan im Frühjahr 1991 prognostiziert beispielsweise, dass sich 1996 fast ein Viertel aller Multimedia-Anwendungen mit der Aus- und Weiterbildung befassen werden.
Bild 8: Der europäische Anwendungsmarkt für Multimedia 1996
Weitere Untersuchungen zeigen, dass 1996 bereits 75 Prozent aller PCs multimediafähig sein werden und dass die Verkaufszahlen für CD-Laufwerke
rapide ansteigen. Zusammenfassend ist anzumerken, dass alle vorliegenden Untersuchungen für Multimedia rosige Zeiten ankündigen.
Der Multimedia-PC
Multimedia vereinigt eine ganze Reihe
unterschiedlicher Techniken miteinander. Bevor im folgenden ein Überblick über die Grundlagen der Audio-Technik, der CD-ROM-Technologie, der elektronischen Bildverarbeitung und verschiedener Druckverfahren gegeben wird,
wird am Beispiel der MPC-Definition die notwendige Mindestausstattung eines Multimedia-Systems gezeigt.
Im PC-Bereich entwickelte Microsoft zusammen mit anderen Hardware- und Softwareherstellern den
MPC-Standard (MPC = Multimedia PC), um eine allgemeingültige Basis für einen multimediafähigen Personalcomputer zu finden. Demnach können Sie sofort mit Multimedia beginnen, wenn Ihr PC mindestens nachfolgende
Anforderungen erfüllt:
- 80386SX-Prozessor, 16 MHz Taktfrequenz
- 2 MB Hauptspeicher
- 30 MB Festplattenkapazität
- 1,44 MB 3,5" Diskettenlaufwerk
- Tastatur mit 101 Tasten und DIN-Anschluss
- Serielle Schnittstelle, programmierbar bis 9600 Baud, Interrupt frei wählbar
- Parallele, bidirektionale Schnittstelle
- Analoger Joystick-Port
- Maus mit 2 Tasten
- Soundkarte mit Stereo-Ausgang und Anschlüssen für Mikrofon und MIDI (Musical Instrumental Digital Interface)
- VGA-Grafik mit einer Auflösung von 640*480 Punkten bei 256 Farben oder einer Auflösung von 800*600 Punkten bei 16 Farben
- CD-ROM-Laufwerk mit einer Datentransferrate von mindestens 150 Kilobyte pro Sekunde und einer maximalen Prozessorauslastung von 40 Prozent
- Windows 3.0 mit Multimedia-Erweiterungen oder Windows 3.1
Es sei jedoch darauf hingewiesen, dass diese Empfehlung das absolut notwendige Minimum beschreibt. Für Multimedia gilt generell die Devise - je schneller und je größer desto besser. Prozessor,
Taktfrequenz, Hauptspeicher, Plattenkapazität, Zugriffszeiten, Transferleistungen, Puffergrößen, Vorhandensein von Hardware-Caches, Leistungsfähigkeit der Grafikkarte etc. beeinflussen Wartezeiten und Qualität der
Anwendungen und tragen damit entscheidend zur Akzeptanz eines Multimedia-Systems bei.
Bild 8: Das MPC-Gütesiegel
Audio, ergo sum
Ein Ton oder eine Tonfolge entspricht einer
Folge von Luftdruckschwankungen, durch die eine Membran im Innern des menschlichen Ohrs bewegt wird. Um Tonfolgen im Computer speichern und bearbeiten zu können, müssen diese Luftdruckschwankungen gemessen und
digitalisiert werden. Ein Mikrofon wandelt zunächst die Luftdruck- in Spannungsschwankungen um, die dann von einem Analog-Digital-Converter (ADC) in eine Folge von Digitalwerten konvertiert wird. Die Qualität der
späteren Tonwiedergabe hängt bei diesem Aufzeichnungsverfahren entscheidend davon ab, wie oft und wie präzise die Spannungsschwankungen gemessen werden. Nach dem Abtasttheorem von Nyquist muss die Frequenz, mit der ein
Signal abgetastet (gesampelt) werden soll, mindestens doppelt so groß sein, wie die maximal auftretende Frequenz des abzutastenden Signals. Das hörbare Frequenzspektrum des Menschen liegt maximal zwischen einem Herz und
20 Kiloherz, so dass die Samplingrate nach Nyquist größer 40 KHz sein sollte, um bei der Tonwiedergabe das ursprüngliche Signal wieder erhalten zu können. Die Amplitudengenauigkeit des Digitalsignals wird durch die
Abtasttiefe bestimmt. Spendiert man beispielsweise 4 Bit zur Speicherung eines abgetasteten Wertes, so sind 16 verschiedene Pegel darstellbar. Die Pegelabweichung, also die Ungenauigkeit des gespeicherten Wertes, kann
somit 100 : 16 = 6,25 Prozent betragen. Bei 8 Bit Signalauflösung (256 Pegel sind darstellbar) erhöht sich die Genauigkeit auf 100 : 256 = 0,39 Prozent, bei 16 Bit auf 100 : 65536 = 0,0015 Prozent. Aus diesen
Betrachtungen können direkte Rückschlüsse auf den Speicherbedarf für Digitalaudio gezogen werden. Bei der in der Multimedia-Praxis üblichen Abtastfrequenz von 44,1 KHz und einer Pegelauflösung von 16 Bit ergibt sich
beispielsweise ein Speicherbedarf von: 44,1 KHz * 16 Bit * 2 Kanäle (Stereo) = 1.411.200 Bit bzw. 176,4 Kilobyte pro Sekunde.
Kompressionsprinzipien
Um diesen Datenstrom bewältigen zu
können, müssen entweder schnelle Speichermedien großer Kapazität bereitstehen oder der Datenstrom muss komprimiert werden.
Ein primitives und sicher nicht verlustfreies Kompressionsverfahren ist die
Reduzierung der Samplingrate. Für Sprachaufzeichnungen reicht oft eine Abtastfrequenz von 22 KHz mit 8 Bit Abtasttiefe in Mono aus, so dass nur ein Achtel der Datenmenge der oben errechneten HiFi-Qualität anfällt (22,05
KHz * 8 Bit = 22,05 Kilobyte). Die Qualität der Tonreproduktion in den höheren Frequenzbereichen wird dadurch zwar eingeschränkt, für Sprachaufzeichnungen ist das allerdings kein Problem.
Andere
Kompressionsverfahren machen sich die Tatsache zunutze, dass die Unterschiede zwischen zwei aufeinanderfolgenden Luftdruckmesswerten außer bei sehr hohen oder verzerrten Tönen meist nur gering sind. Während zur
verlustfreien Speicherung von Tondaten üblicherweise 16 Bit je Abtastwert benötigt werden, reicht es meist aus, die geringen Differenzen zwischen zwei aufeinanderfolgenden Messwerten mit nur 4 Bit zu codieren, um wieder
die original Tondaten rekonstruieren zu können. Anwendung findet diese Technik beim DPCM-Verfahren (Differential Pulse Code Modulation), das nur die Signaldifferenz des folgenden Abtastsignals zum vorherigen
Abtastsignal mit je 4 Bit abspeichert und so eine Kompression um etwa den Faktor 4 ermöglicht. Das ADPCM-Verfahren (Adaptive DPCM) ist noch intelligenter und verändert die Abtasttiefe abhängig vom aktuellen Signalpegel.
Das ADPCM-Verfahren ist sehr bekannt, da es unter anderem im CD-ROM-XA- und CD-I-Standard Eingang gefunden hat und in den entsprechenden CD-ROM-Laufwerken in Hardware realisiert ist (das Thema CD-ROM wird in der
nächsten Folge dieser Serie besprochen). Weitere vergleichbare Kompressionsverfahren liefern Kompressionsfaktoren von 1:3, 1:6 oder 1:8 bei unterschiedlicher Klangqualität und sind teilweise als Softwareroutinen
implementiert (Beispiel: MACE - Macintosh Audio Compression an Expansion).
Die Soundkarte
Um den PC Audio-fähig zu machen, wird eine Soundkarte integriert, mittels derer beliebige Töne
aufgenommen, erzeugt und wiedergegeben werden können. Die Karte erweitert den PC um die entsprechenden Anschlüsse für Mikrofon und HiFi-Anlage. Externe Synthesizer können über eine MIDI-Schnittstelle (MIDI = Musical
Instrument Digital Interface) angesteuert werden. Ebenso sind externe Aktiv- oder Passivlautsprecher an die Soundkarte anschließbar. Vorteilhaft ist es, wenn die Audiokarte über eine eigene AT-Bus- oder
SCSI-Schnittstelle (SCSI = Small Computer System Interface) verfügt, so dass die Karte direkt mit dem CD-ROM-Laufwerk verbunden werden kann.
Bild 10: Soundkarte mit allen Anschlüssen
MIDI
MIDI bezeichnet ein standardisiertes Dateiformat und eine standardisierte Hardware-Schnittstelle zur herstellerübergreifenden Übertragung und Speicherung von Tondateien. Hierbei werden nicht die Töne an
sich, sondern nur die Eckwerte wie Tonhöhe, Länge, Klangbild, Lautstärke etc. so wie die Namen der Instrumente übergeben. Erst der Synthesizer-Chip der Soundkarte oder ein an der MIDI-Schnittstelle angeschlossener
externer Synthesizer bilden daraus die eigentlichen Töne. Dadurch ergibt sich im Gegensatz zu den sonst bei MPCs üblichen Wave-Dateien, die die Toninformationen in Form digitalisierter Töne enthalten, ein wesentlich
geringerer Speicherplatzbedarf. Eine Minute Sound ergibt eine MIDI-Datei (*.MID) von ca. 20 Kilobyte, während eine entsprechende Wave-Datei (*.WAV) etwa 1,3 Megabyte verbrauchen würde. Trotz dieses Vorteils hat MIDI für
Multimedia-Anwendungen nur eine stark eingeschränkte Bedeutung, da mit MIDI-fähigen Synthesizern zwar Musik und Soundeffekte erzeugt werden können aber keine Aufzeichnung und Wiedergabe beliebiger Tonfolgen möglich ist.
Die Software zur Karte
Zur Bearbeitung der Audiodateien bietet die Microsoft Multimedia Extension Ihres MPC einen "Sound Recorder" und einen "Mixer". Der Sound
Recorder hilft bei der Aufnahme von Tonfolgen, indem er mit einer Art Oszilloskop Unter- und Übersteuerungen anzeigt und es erlaubt, Tonsequenzen mittels Echo, Geschwindigkeitsänderungen und Rückwärtsabspielen zu
verfremden. Über den Mixer können Sie die Lautstärken der verschiedenen Tonkanäle (Mikrofon, Line-In, etc.) steuern.
Einsatzgebiete
Neben den hauptsächlich im privaten Bereich
anzutreffenden Anwendungen wie Abspielen von Audio-CDs, Komponieren von Musikstücken, Vertonen von Urlaubsfilmen, etc. wird sich die Audiofähigkeit eines Multimedia-Systems im professionellen Bereich in erster Linie der
digitalisierten Sprache bedienen. Heute kommt digitale Sprache bereits in folgenden Bereichen zum Einsatz:
- Digitalisierte Sprach- und Tonsequenzen an POS/POI-Stationen und bei Präsentationen
- Spracheinbindung in E-Mail-Systeme (Voice-Mail) und digitale Anrufbeantworter
- Synthetische Erzeugung von Sprache aus im Computer gespeicherten Textdokumenten
- Steuerung von Computeranwendungen durch gesprochene Befehle (Spracherkennung)
Die meisten verfügbaren Produkte sind allerdings noch nicht ausgereift. Die Spracherkennung beschränkt sich beispielsweise darauf, dass der Computer einige Dutzend Wörter erkennen kann, er aber in den
meisten Fällen auf die Stimme nur eines bestimmten Benutzers trainiert ist. Sollen die Anweisungen beliebiger Benutzer verstanden werden, müssen dem Computer gleiche Wörter in verschiedener Stimmlage beigebracht werden
(z.B. 10 verschiedene Varianten des Wortes "Ja"). Der Bedarf in der Industrie ist jedoch vorhanden. Eine Vielzahl von Arbeitsabläufen könnte vereinfacht und beschleunigt werden, könnte der Computer
uneingeschränkt die menschliche Sprache verstehen. Man denke hierbei an Arbeiten bei denen Hände und/oder Augen beschäftigt sind, wie beispielsweise Arbeiten am Mikroskop oder bei der Qualitätskontrolle. Auch ist sicher
ein Markt für Voice Mail vorhanden - eine erneute Untersuchung von Frost & Sullivan zeigt: bis 1996 wird sich dieser Markt vervierfachen.
Bereits im ersten Teil dieser Serie wurde deutlich, dass
Multimedia gleichzusetzen ist mit großem Speicherplatzbedarf. Neue Anforderungen an Massenspeicher sind in diesem Zusammenhang zu stellen. Der zweite Teil der Serie wird sich mit dieser Problematik beschäftigen und
insbesondere die Massenspeicher der Zukunft, die CD-ROMs, unter die Lupe nehmen.
- Fortsetzung folgt -
Literatur
- Harald Frater, Dirk Paulissen, Das große Buch zu Multimedia, Data Becker, 1993
- Calogero Messina, Was ist Multimedia?, Hanser Verlag, 1993
- Wolfgang Müller (Hrsg.), Franz-Reinhard Habbel, Multimedia - Interaktive Medien in Städten und Gemeinden, Gemini Multimedia Verlag, 1993
- Joachim Graf, Daniel Treplin, Multimedia-Handbuch, High Text Verlag, 1993
- Softline, Problemlösungen 6, Winter 92/93
- Multimedia mit dem Apple Macintosh, Vorsprung durch Medienintegration, Broschüre von Apple Computer
- Klaus-D. Klingberg (Hrsg.), ABC der Multimediatechnologie, Multikom Verlag