|
Werkzeuge zur Web-Analyse machen den Erfolg von Webseiten messbar Dem Surfer auf der Spur Da die Konkurrenz im Internet nur einen Mausklick entfernt ist, muss die
Internet-Präsenz eines Unternehmens optimal auf die Bedürfnisse der Website-Besucher angepasst sein. Web-Analyse-Werkzeuge bieten viele Funktionen, um das Benutzerverhalten transparent zu machen. Sie ermöglichen die
Erfolgsmessung von Online-Aktivitäten und liefern wertvolle Hilfestellung zur Optimierung von Websites.Von Klaus Eppele
Die punkt.de GmbH (früher Web Internet Services Systemhaus GmbH) ist in Karlsruhe seit 1998 als Systemhaus tätig. Mit einem abgerundeten Spektrum
an Produkten und Dienstleistungen unterstützen 20 Mitarbeiter über 100 Unternehmen aus vielen verschiedenen Branchen bei der professionellen Anbindung ihrer Firmennetzwerke an das
Internet. Dazu bietet punkt.de
- umfangreiche Internet-Dienstleistungen, wie Internet-Zugänge, sicheres Server-Hosting im eigenen Rechenzentrum und System-Überwachung,
- fachmännische Implementierung effizienter Web-Präsenzen von der Konzepterstellung über die Integration von Shop-Lösungen bis hin zur Erfolgs-Analyse von Internet-Seiten,
- die Realisierung schlüsselfertiger Firewall-, Virtual-Private-Network-, Antiviren-, Voice-over-IP- oder Internet-Access-Server-Lösungen sowie
- die Wissensvermittlung durch individuell zugeschnittene Schulungen.
Partnerschaften mit renommierten Herstellern von Hard- und Software garantieren für hochwertige Lösungen: punkt.de ist u. a. Cisco Partner Premier Certified, F-Secure Solution Provider,
Sun Enterprise Solution Reseller, Innovaphone Autorisierter Reseller, Ripe NCC Mitglied und Sane Solution Exclusive Authorized Dealer für Deutschland, Österreich, die Schweiz und
Liechtenstein. Weitere Informationen unter: www.punkt.de und www.nettracker.at.
|
Wer eine Internet-Präsenz betreibt und finanziert sollte wissen, ob sich sein Engagement im Internet auch rechnet. Die systematische und
kontinuierliche Auswertung von Kunden- und Nutzerdaten bringt hier Gewissheit. Mit einem Web-Analyse-System kann ein Webmaster detaillierte Informationen über die Besucher und deren Verhalten ermitteln. Diese
Informationen dienen, statistisch und grafisch aufbereitet, als wesentliche Entscheidungsgrundlage zur Planung und Optimierung künftiger E-Business-Aktivitäten.Web-Analyse liefert beispielsweise Aussagen
darüber, wie häufig die einzelnen Seiten einer Internetpräsenz besucht werden. Dies gibt Aufschluss über die Attraktivität des
Internetauftritts und die Popularität der einzelnen Inhalte. Für jeden Website-Besucher lässt sich ermitteln, wo er in die Website eingestiegen ist, durch welchen Banner oder welche
Suchmaschine und welche Suchbegriffe er auf die Website gelangte, auf welchem Weg er durch die Website navigierte, wo, wann und manchmal auch warum er die Website wieder
verließ, zu welcher Zeit er die Website besuchte, zum wievielten Mal er schon da war und über welche technische Ausstattung er verfügt. Diese Informationen lassen sich vielfältig
verwerten: So erkennt die Werbeabteilung, welche Werbebanner sich lohnen und welche nicht und auf welche Suchbegriffe die Website optimiert werden sollte. Die Marketingabteilung kann
nachvollziehen, wie häufig einzelne Angebote angesteuert, aber vielleicht nicht bestellt werden, und welche Webinhalte das Interesse des Besuchers beeinflussen und ihn zur
weiteren Navigation oder zum Verlassen der Website bewegen. Der Web-Designer kann die Webseiten auf die technische Ausstattung der Besucher optimieren und anhand von
Rückgabecodes erkennen, ob alle Elemente der Website einwandfrei funktionieren. Darüber hinaus sind viele weitere Auswertungen möglich, die jeweils für spezielle Zielgruppen nützlich sein können.
Mittels Web-Analyse erhält man auch Informationen über den Besucher selbst. Die Logdatei des Webservers liefert den Host-Namen oder die IP-Adresse des Besuchers, womit man
dessen Firma herausbekommen kann. Diese Daten kann man mit den Angaben des Besuchers, die er selbst bei Bestellungen oder Gewinnspielen in die Website eingibt, und
anderen Datenquellen, wie den eigenen Kunden- oder Support-Datenbanken, kombinieren. Darüber hinaus besteht die Möglichkeit, den Umsatz eines eShops zu errechnen und diesen
aufzulisten oder grafisch darzustellen, Website-Besucher nach ihren Interessen zu klassifizieren und das Online-Verhalten von kaufenden und nichtkaufenden Besuchern zu analysieren und zu vergleichen.
Wie funktioniert das?
Immer wenn ein Browser eine Anforderung an einen Webserver stellt, schreibt der Webserver eine Zeile in eine Log-Datei. Die einzelnen Zeilen dieser Textdatei enthalten Daten wie
IP-Adresse, Domänenname, Datum, Uhrzeit, Typ der Anforderung, URL (Uniform Resource Locator), Protokollversion, Returncode, Größe der Datei in Byte, Referer, Webbrowser und
technische Plattform. Beispielsweise könnte eine Zeile im Logfile wie folgt aussehen:
ras.sane.com – fa6782 [11/Apr/2002:10:55:32 +0500] „GET /quotes/customer_quote.cfm? symbol=123 HTTP/1.1” 200 4425 www.punkt.de http://www.improve-mtc.de/refernzen.html
“Mozilla/4.0 (compatible; MSIE 5.5; Windows ME)” Dieser Eintrag ist entstanden, als ein Client mit dem Domänename „ras.sane.com“ und der
Nutzer-Authentisierung „fa6782“ am 11. April 2002 um 15.55.32 Uhr GMT unter Verwendung des Hypertext Transfer Protokolls (HTTP) in der Version 1.1 über einen Link (Referrer) auf der
Seite „www.improve-mtc.de/refernzen.html“ auf das Verzeichnis „/quotes/customer_quote.cfm“ der Site „www.punkt.de“ mit dem Parameter „symbol=123“ zugegriffen hat. Der Webserver hat
mit dem Returncode 200 „OK“ reagiert und 4425 Byte an den Client gesendet. Der Client verwendete den Microsoft Internet Explorer in der Version 5.5 und das Betriebssystem Windows ME.
Jeder Zugriff auf ein Element einer Webseite (Bild, Skript, HTML-Seite,...) erzeugt einen Eintrag im Logfile, was die Logfiles schnell sehr groß und unübersichtlich werden lässt. Eine
Logfile-Analyse-Software ordnet diese Rohdaten und verwandelt sie in brauchbare Informationen. Indem sie die Zeilen des Logfiles nach IP-Adressen oder Domänen ordnet,
kann sie die einzelnen Anforderungen nach HTTP-Elementen (Hits) zu den gesehenen Seiten (Page Views) zusammensetzen. Ordnet sie alle diese Page Views entlang der Zeitachse,
erhält sie die Abfolge der von einem Besucher angeforderten Seiten (Click Stream) während dessen kompletten Aufenthalts (Visit) auf der Website (siehe Bild 1).  Bild 1: Die Web-Analyse-Software sorgt u.a. dafür, dass der Webmaster nicht die Anzahl der Hits, sondern die Anzahl der unterschiedlichen Besucher angezeigt bekommt (Quelle:
improve) Vom Hit zum User
Viele Logfile-Analysierer können die Hostnamen bzw. die IP-Adressen, die Zeit zwischen den einzelnen Page Views, die Browser-Typen und die Vorgängerseiten (Referrer) kombinieren
und mittels komplexer Heuristiken Rückschlüsse auf die Anzahl und das Verhalten der Benutzer ziehen. Einfacher geht dies durch die Verwendung von Cookies. Ein Cookie ist ein
Stückchen Information, das der Webserver generiert und auf dem Rechner des Besuchers ablegt. Dies funktioniert folgendermaßen:
Wenn ein Webbrowser eine HTTP-Seite von einem Webserver anfordert, sendet er einen HTTP-Request. Der folgende Request:
GET /products/NetTracker/index.html HTTP/1.1 User-Agent: Mozilla/4.0
fordert mittels HTTP 1.1 die Seite „/products/NetTracker/index.html“ an und teilt dem Webserver mit, dass als Webbrowser Netscape Communicator (Mozilla) 4.0 verwendet wird.
Der Webserver sendet daraufhin die angeforderte Webseite zusammen mit einem Cookie zurück, das auf dem Client abgelegt wird: HTTP/1.1 200 OK
Date: Thu, 11 Apr 2002 16:31:22 GMT Server: Netscape-Enterprise/3.6 Set-Cookie: SaneID=208.144.251.1-936198876; path=/; expires=Tue, 31-Aug-04 12:00:00 GMT Connection: close Content-Type: text/html
<HTML> <HEAD> <TITLE>NetTracker Log File Analysis and Usage Tracking Software</TITLE> .... </HTML> Wenn derselbe Browser wieder eine Seite vom selben Webserver anfordert, sendet er das Cookie
GET /products/NetTracker/index.html HTTP/1.1 User-Agent: Mozilla/4.0 Cookie: SaneID=208.144.251.1-936198876
zurück und identifziert sich damit. Moderne Webanalyse-Lösungen werten diese Cookies aus und können somit feststellen, ob ein Besucher zum ersten Mal auf die Webseite kommt bzw. ob und wann er schon einmal da war.
Sammeln, analysieren, präsentieren
Webanalyse gliedert sich in die drei Stufen: sammeln, analysieren, präsentieren. Nachdem die Daten in den Logfiles gesammelt wurden, werden diese analysiert und sinnvoll zu Page
Views und Visits vereint. Hier ist es wichtig, dass die Logfile-Analyse-Software die verschiedenen Logfile-Formate der verschiedenen Hersteller wie das Common Logfile Format
(CLF), das Combinded Logfile Format (DLF), das Extended Logfile Format (ELF), das NCSA Common Format, das W3C Extend Format, das Microsoft IIS Format, etc. unterstützt.
Zur Erstellung der Reports werden die analysierten Daten in eine Datenbank eingelesen. Dabei können einige Analysetools bereits überflüssige Informationen ausfiltern.
Beispielsweise ist es sinnvoll, den eigenen Domainnamen auszufiltern, wenn dieser als Referer-Adresse auftaucht. Dies ist immer dann der Fall, wenn sich ein Benutzer innerhalb der
Website bewegt. Diese Filterung verhindert, dass die Datenbank unnötig groß wird und der eigene Domainname in der Referer-Top-Ten auftaucht.
Nach dem Einlesen in die Datenbank können die gewünschten Übersichten, Berichte, Grafiken und Charts erstellt werden. Von Vorteil ist es, wenn die Analysesoftware in dieser
Phase die Logfile-Daten mit den Inhalten anderer Datenbanken verbinden kann, so dass man zu einem Website-Besucher gleich weitere Informationen wie Name, Adresse, Umsatz etc.
angezeigt bekommt. Außerdem ist es wichtig, dass die Logfile-Daten nicht für jeden Bericht erneut eingelesen werden müssen. Aus einmal in die Datenbank eingelesenen Daten sollte
man mittels Drill-Down-Funktionen beliebige Berichte und Übersichten erzeugen können, ohne die bis zu mehrere Gigabyte großen Logfiles jedes mal erneut einlesen zu müssen.  Bild 2: Eine verteilte Architektur ermöglicht skalierbare Webanalyse-Lösungen. Web-Server, Webanalyse-Software und Datenbank können je nach Anforderung gemeinsam auf einem
System oder verteilt auf mehreren Systemen implementiert werden (Quelle: improve) Skalierbarkeit ist wichtig
Skalierbare Lösung NetTracker ist in drei Versionen verfügbar:
- NetTracker Professional
wurde entwickelt für die Analyse einzelner Internet- und Intranet-Webseiten. Die Software liefert 35 standardisierte Zusammenfassungen. Zusätzlich
kann man individualisierte Reports erstellen, die detaillierte Informationen über das Nutzerverhalten liefern. Der Netto-Preis beträgt 590 Euro.
- NetTracker Enterprise
eignet sich hervorragend für große Organisationen mit geclusterten Web-Präsenzen. Die Software konsolidiert und analysiert die Logfiles von allen Webseiten,
FTP-Servern, multiplen Proxy-Servern und den vorhandenen Firewalls zur Erfassung des Nutzungsverhaltens innerhalb der eigenen Organisation. Der Netto-Preis für diese Version
beginnt bei 1.180 Euro.
- Die NetTracker eBusiness Edition ist eine hochgradig skalierbare Lösung für eCommerce Sites. Diese Variante eignet sich besonders zur Analyse von sehr großen Logfiles mit Einträgen
von mehreren Gigabyte pro Tag. Die Analysedaten können automatisch mit anderen Datenquellen verknüpft werden. Anstatt der integrierten Datenbank nutzt die NetTracker
eBusiness Edition entweder Oracle8- oder SQL-Server Datenbanken zur Speicherung der ermittelten Informationen. Der Netto-Preis beginnt hier bei 29.600 Euro.
Eine Demo-Version von NetTracker findet man als Download (15 Tage gültig) unter: http://www.nettracker.at/downloadrequest.htm. |
Eine Webanalyse-Software sollte mit den Anforderungen wachsen und auch verteilte Websites bedienen können. Eine leistungsfähige, mehrstufig
aufgebaute Lösung stellt die Software NetTracker der Firma Sane Solutions dar. Authorisierte Benutzer können sich die gewünschten Analysen von einer Web-basierten Bedienoberfläche (erste Stufe) via Internet/Intranet
von einem Application Server anfordern auf dem die NetTracker-Software (zweite Stufe) läuft. Hier werden aus den verschiedenen Logfiles der Web-Server die gewünschten Reports erstellt und auf dem
Datenbank-Server, der dritten Stufe der verteilten NetTracker-Architektur, gespeichert oder archiviert (siehe Bild 2).Diese verteilte Architektur macht NetTracker skalierbar für die
Analyse kleiner Websites mit weniger als einem Megabyte an Log-Daten pro Tag bis hin zu großen, geclusterten Web-Server-Farmen, die täglich mehrere Gigabyte an Logfiles generieren. Je nach Anforderung
können alle drei Stufen dieser Architektur auf einem Rechner oder jeweils auf eigenen Rechnern installiert werden. Die verteilte Architektur macht es
auch möglich, dass vorhandene Reports annähernd in Echtzeit aktualisiert werden können. Wenn NetTracker direkt auf dem Webserver installiert wird, kann man neue Logdaten einfach
durch Betätigen eines Update-Buttons analysieren und die Ergebnisse den vorhandenen Berichten hinzufügen. Die großen Log-Dateien lassen sich glücklicherweise mit einem Kompressionsfaktor von bis
zu 90 Prozent komprimieren. Während viele Logfile-Analysatoren die Daten vor der Verarbeitung dekomprimieren und danach wieder zusammenpacken müssen, kann
NetTracker die komprimierten Daten direkt verarbeiten und somit viel Zeit und Festplattenplatz einsparen. NetTracker ist verfügbar für Windows-, Macintosh- und UNIX-Umgebungen (FreeBSD, Solaris,
Linux, AIX, HP-UX, etc). Die Software kann neben den Logfile-Formaten verschiedener Webserver, die Logfiles von Streaming Media Servern, Proxy Servern, Firewalls und
FTP-Servern analysieren und deren Inhalte zu einheitlichen Reports vereinen. Viele Analysen, wie die Top-Ten der abgerufenen Seiten, der treuesten Besucher oder der häufigsten Verweise
können mittels integrierter Standardroutinen quasi auf Knopfdruck erstellt werden. Aber auch beliebig andere, kundenspezifischen Übersichten lassen sich leicht mithilfe der mitgelieferten
NetTracker-Wizards und -templates erstellen.
Bild 3: Die intuitive Bediener-Oberfläche von NetTracker (Quelle: Sane Solutions)
AutorDer Autor Dipl. Inform. Klaus Eppele ist Inhaber der Firma improve
marketing-training-consulting, Karlsruhe, www.improve-mtc.de. improve marketing-training-consulting Dipl. Inform. Klaus Eppele
Heinrich-Weitz-Str. 31 76228 Karlsruhe Tel: 07 21 / 94 74 621 Fax: 07 21 / 94 74 622 eMail:
eppele@improve-mtc.de URL: http://www.improve-mtc.de Erschien in der Datacom 07/02, Seiten 38 - 40 |