Home - improve
Unser Angebot
Presse-Forum
Veröffentlichungen
Referenzen
Kontakt
Termine
Logo improve

Werkzeuge zur Web-Analyse machen den Erfolg von Webseiten messbar

Dem Surfer auf der Spur

Da die Konkurrenz im Internet nur einen Mausklick entfernt ist, muss die Internet-Präsenz eines Unternehmens optimal auf die Bedürfnisse der Website-Besucher angepasst sein. Web-Analyse-Werkzeuge bieten viele Funktionen, um das Benutzerverhalten transparent zu machen. Sie ermöglichen die Erfolgsmessung von Online-Aktivitäten und liefern wertvolle Hilfestellung zur Optimierung von Websites.

Von Klaus Eppele

Logo punkt.deDie punkt.de GmbH (früher Web Internet Services Systemhaus GmbH) ist in Karlsruhe seit 1998 als Systemhaus tätig. Mit einem abgerundeten Spektrum an Produkten und Dienstleistungen unterstützen 20 Mitarbeiter über 100 Unternehmen aus vielen verschiedenen Branchen bei der professionellen Anbindung ihrer Firmennetzwerke an das Internet. Dazu bietet punkt.de

  • umfangreiche Internet-Dienstleistungen, wie Internet-Zugänge, sicheres Server-Hosting im eigenen Rechenzentrum und System-Überwachung,
  • fachmännische Implementierung effizienter Web-Präsenzen von der Konzepterstellung über die Integration von Shop-Lösungen bis hin zur Erfolgs-Analyse von Internet-Seiten,
  • die Realisierung schlüsselfertiger Firewall-, Virtual-Private-Network-, Antiviren-, Voice-over-IP- oder Internet-Access-Server-Lösungen sowie
  • die Wissensvermittlung durch individuell zugeschnittene Schulungen.

Partnerschaften mit renommierten Herstellern von Hard- und Software garantieren für hochwertige Lösungen: punkt.de ist u. a. Cisco Partner Premier Certified, F-Secure Solution Provider, Sun Enterprise Solution Reseller, Innovaphone Autorisierter Reseller, Ripe NCC Mitglied und Sane Solution Exclusive Authorized Dealer für Deutschland, Österreich, die Schweiz und Liechtenstein. Weitere Informationen unter: www.punkt.de und www.nettracker.at.

Wer eine Internet-Präsenz betreibt und finanziert sollte wissen, ob sich sein Engagement im Internet auch rechnet. Die systematische und kontinuierliche Auswertung von Kunden- und Nutzerdaten bringt hier Gewissheit. Mit einem Web-Analyse-System kann ein Webmaster detaillierte Informationen über die Besucher und deren Verhalten ermitteln. Diese Informationen dienen, statistisch und grafisch aufbereitet, als wesentliche Entscheidungsgrundlage zur Planung und Optimierung künftiger E-Business-Aktivitäten.

Web-Analyse liefert beispielsweise Aussagen darüber, wie häufig die einzelnen Seiten einer Internetpräsenz besucht werden. Dies gibt Aufschluss über die Attraktivität des Internetauftritts und die Popularität der einzelnen Inhalte. Für jeden Website-Besucher lässt sich ermitteln, wo er in die Website eingestiegen ist, durch welchen Banner oder welche Suchmaschine und welche Suchbegriffe er auf die Website gelangte, auf welchem Weg er durch die Website navigierte, wo, wann und manchmal auch warum er die Website wieder verließ, zu welcher Zeit er die Website besuchte, zum wievielten Mal er schon da war und über welche technische Ausstattung er verfügt. Diese Informationen lassen sich vielfältig verwerten: So erkennt die Werbeabteilung, welche Werbebanner sich lohnen und welche nicht und auf welche Suchbegriffe die Website optimiert werden sollte. Die Marketingabteilung kann nachvollziehen, wie häufig einzelne Angebote angesteuert, aber vielleicht nicht bestellt werden, und welche Webinhalte das Interesse des Besuchers beeinflussen und ihn zur weiteren Navigation oder zum Verlassen der Website bewegen. Der Web-Designer kann die Webseiten auf die technische Ausstattung der Besucher optimieren und anhand von Rückgabecodes erkennen, ob alle Elemente der Website einwandfrei funktionieren. Darüber hinaus sind viele weitere Auswertungen möglich, die jeweils für spezielle Zielgruppen nützlich sein können.

Mittels Web-Analyse erhält man auch Informationen über den Besucher selbst. Die Logdatei des Webservers liefert den Host-Namen oder die IP-Adresse des Besuchers, womit man dessen Firma herausbekommen kann. Diese Daten kann man mit den Angaben des Besuchers, die er selbst bei Bestellungen oder Gewinnspielen in die Website eingibt, und anderen Datenquellen, wie den eigenen Kunden- oder Support-Datenbanken, kombinieren. Darüber hinaus besteht die Möglichkeit, den Umsatz eines eShops zu errechnen und diesen aufzulisten oder grafisch darzustellen, Website-Besucher nach ihren Interessen zu klassifizieren und das Online-Verhalten von kaufenden und nichtkaufenden Besuchern zu analysieren und zu vergleichen.

 

Wie funktioniert das?

Immer wenn ein Browser eine Anforderung an einen Webserver stellt, schreibt der Webserver eine Zeile in eine Log-Datei. Die einzelnen Zeilen dieser Textdatei enthalten Daten wie IP-Adresse, Domänenname, Datum, Uhrzeit, Typ der Anforderung, URL (Uniform Resource Locator), Protokollversion, Returncode, Größe der Datei in Byte, Referer, Webbrowser und technische Plattform. Beispielsweise könnte eine Zeile im Logfile wie folgt aussehen:

ras.sane.com – fa6782 [11/Apr/2002:10:55:32 +0500] „GET /quotes/customer_quote.cfm? symbol=123 HTTP/1.1” 200 4425 www.punkt.de http://www.improve-mtc.de/refernzen.html “Mozilla/4.0 (compatible; MSIE 5.5; Windows ME)”

Dieser Eintrag ist entstanden, als ein Client mit dem Domänename „ras.sane.com“ und der Nutzer-Authentisierung „fa6782“ am 11. April 2002 um 15.55.32 Uhr GMT unter Verwendung des Hypertext Transfer Protokolls (HTTP) in der Version 1.1 über einen Link (Referrer) auf der Seite „www.improve-mtc.de/refernzen.html“ auf das Verzeichnis „/quotes/customer_quote.cfm“ der Site „www.punkt.de“ mit dem Parameter „symbol=123“ zugegriffen hat. Der Webserver hat mit dem Returncode 200 „OK“ reagiert und 4425 Byte an den Client gesendet. Der Client verwendete den Microsoft Internet Explorer in der Version 5.5 und das Betriebssystem Windows ME.

Jeder Zugriff auf ein Element einer Webseite (Bild, Skript, HTML-Seite,...) erzeugt einen Eintrag im Logfile, was die Logfiles schnell sehr groß und unübersichtlich werden lässt. Eine Logfile-Analyse-Software ordnet diese Rohdaten und verwandelt sie in brauchbare Informationen. Indem sie die Zeilen des Logfiles nach IP-Adressen oder Domänen ordnet, kann sie die einzelnen Anforderungen nach HTTP-Elementen (Hits) zu den gesehenen Seiten (Page Views) zusammensetzen. Ordnet sie alle diese Page Views entlang der Zeitachse, erhält sie die Abfolge der von einem Besucher angeforderten Seiten (Click Stream) während dessen kompletten Aufenthalts (Visit) auf der Website (siehe Bild 1).

Vom Hit zum User 

Bild 1: Die Web-Analyse-Software sorgt u.a. dafür, dass der Webmaster nicht die Anzahl der Hits, sondern die Anzahl der unterschiedlichen Besucher angezeigt bekommt (Quelle: improve)

 

Vom Hit zum User

Viele Logfile-Analysierer können die Hostnamen bzw. die IP-Adressen, die Zeit zwischen den einzelnen Page Views, die Browser-Typen und die Vorgängerseiten (Referrer) kombinieren und mittels komplexer Heuristiken Rückschlüsse auf die Anzahl und das Verhalten der Benutzer ziehen. Einfacher geht dies durch die Verwendung von Cookies. Ein Cookie ist ein Stückchen Information, das der Webserver generiert und auf dem Rechner des Besuchers ablegt. Dies funktioniert folgendermaßen:

Wenn ein Webbrowser eine HTTP-Seite von einem Webserver anfordert, sendet er einen HTTP-Request. Der folgende Request:

GET /products/NetTracker/index.html  HTTP/1.1
User-Agent: Mozilla/4.0

fordert mittels HTTP 1.1 die Seite „/products/NetTracker/index.html“ an und teilt dem Webserver mit, dass als Webbrowser Netscape Communicator (Mozilla) 4.0 verwendet wird. Der Webserver sendet daraufhin die angeforderte Webseite zusammen mit einem Cookie zurück, das auf dem Client abgelegt wird:

HTTP/1.1 200 OK
Date: Thu, 11 Apr 2002 16:31:22 GMT
Server: Netscape-Enterprise/3.6
Set-Cookie: SaneID=208.144.251.1-936198876; path=/; expires=Tue, 31-Aug-04 12:00:00 GMT
Connection: close
Content-Type: text/html

<HTML>
<HEAD>
<TITLE>NetTracker Log File Analysis and Usage Tracking Software</TITLE>
....
</HTML>

Wenn derselbe Browser wieder eine Seite vom selben Webserver anfordert, sendet er das Cookie

GET /products/NetTracker/index.html  HTTP/1.1
User-Agent: Mozilla/4.0
Cookie: SaneID=208.144.251.1-936198876

zurück und identifziert sich damit. Moderne Webanalyse-Lösungen werten diese Cookies aus und können somit feststellen, ob ein Besucher zum ersten Mal auf die Webseite kommt bzw. ob und wann er schon einmal da war.

 

Sammeln, analysieren, präsentieren

Webanalyse gliedert sich in die drei Stufen: sammeln, analysieren, präsentieren. Nachdem die Daten in den Logfiles gesammelt wurden, werden diese analysiert und sinnvoll zu Page Views und Visits vereint. Hier ist es wichtig, dass die Logfile-Analyse-Software die verschiedenen Logfile-Formate der verschiedenen Hersteller wie das Common Logfile Format (CLF), das Combinded Logfile Format (DLF), das Extended Logfile Format (ELF), das NCSA Common Format, das W3C Extend Format, das Microsoft IIS Format, etc. unterstützt.

Zur Erstellung der Reports werden die analysierten Daten in eine Datenbank eingelesen. Dabei können einige Analysetools bereits überflüssige Informationen ausfiltern. Beispielsweise ist es sinnvoll, den eigenen Domainnamen auszufiltern, wenn dieser als Referer-Adresse auftaucht. Dies ist immer dann der Fall, wenn sich ein Benutzer innerhalb der Website bewegt. Diese Filterung verhindert, dass die Datenbank unnötig groß wird und der eigene Domainname in der Referer-Top-Ten auftaucht.

Nach dem Einlesen in die Datenbank können die gewünschten Übersichten, Berichte, Grafiken und Charts erstellt werden. Von Vorteil ist es, wenn die Analysesoftware in dieser Phase die Logfile-Daten mit den Inhalten anderer Datenbanken verbinden kann, so dass man zu einem Website-Besucher gleich weitere Informationen wie Name, Adresse, Umsatz etc. angezeigt bekommt. Außerdem ist es wichtig, dass die Logfile-Daten nicht für jeden Bericht erneut eingelesen werden müssen. Aus einmal in die Datenbank eingelesenen Daten sollte man mittels Drill-Down-Funktionen beliebige Berichte und Übersichten erzeugen können, ohne die bis zu mehrere Gigabyte großen Logfiles jedes mal erneut einlesen zu müssen.

3-tier Konzept 

Bild 2: Eine verteilte Architektur ermöglicht skalierbare Webanalyse-Lösungen. Web-Server, Webanalyse-Software und Datenbank können je nach Anforderung gemeinsam auf einem System oder verteilt auf mehreren Systemen implementiert werden (Quelle: improve)

 

Skalierbarkeit ist wichtig

NetTracker Logo 

Skalierbare Lösung

NetTracker ist in drei Versionen verfügbar:

  • NetTracker Professional wurde entwickelt für die Analyse einzelner Internet- und Intranet-Webseiten. Die Software liefert 35 standardisierte Zusammenfassungen. Zusätzlich kann man individualisierte Reports erstellen, die detaillierte Informationen über das Nutzerverhalten liefern. Der Netto-Preis beträgt 590 Euro.
  • NetTracker Enterprise eignet sich hervorragend für große Organisationen mit geclusterten Web-Präsenzen. Die Software konsolidiert und analysiert die Logfiles von allen Webseiten, FTP-Servern, multiplen Proxy-Servern und den vorhandenen Firewalls zur Erfassung des  Nutzungsverhaltens innerhalb der eigenen Organisation. Der Netto-Preis für diese Version beginnt bei 1.180 Euro.
  • Die NetTracker eBusiness Edition ist eine hochgradig skalierbare Lösung für eCommerce Sites. Diese Variante eignet sich besonders zur Analyse von sehr großen Logfiles mit Einträgen von mehreren Gigabyte pro Tag. Die Analysedaten können automatisch mit anderen Datenquellen verknüpft werden. Anstatt der integrierten Datenbank nutzt die NetTracker eBusiness Edition entweder Oracle8- oder SQL-Server Datenbanken zur Speicherung der ermittelten Informationen. Der Netto-Preis beginnt hier bei 29.600 Euro.

Eine Demo-Version von NetTracker findet man als Download (15 Tage gültig) unter: http://www.nettracker.at/downloadrequest.htm.

Eine Webanalyse-Software sollte mit den Anforderungen wachsen und auch verteilte Websites bedienen können. Eine leistungsfähige, mehrstufig aufgebaute Lösung stellt die Software NetTracker der Firma Sane Solutions dar. Authorisierte Benutzer können sich die gewünschten Analysen von einer Web-basierten Bedienoberfläche (erste Stufe) via Internet/Intranet von einem Application Server anfordern auf dem die NetTracker-Software (zweite Stufe) läuft. Hier werden aus den verschiedenen Logfiles der Web-Server die gewünschten Reports erstellt und auf dem Datenbank-Server, der dritten Stufe der verteilten NetTracker-Architektur, gespeichert oder archiviert (siehe Bild 2).

Diese verteilte Architektur macht NetTracker skalierbar für die Analyse kleiner Websites mit weniger als einem Megabyte an Log-Daten pro Tag bis hin zu großen, geclusterten Web-Server-Farmen, die täglich mehrere Gigabyte an Logfiles generieren. Je nach Anforderung können alle drei Stufen dieser Architektur auf einem Rechner oder jeweils auf eigenen Rechnern installiert werden.

Die verteilte Architektur macht es auch möglich, dass vorhandene Reports annähernd in Echtzeit aktualisiert werden können. Wenn NetTracker direkt auf dem Webserver installiert wird, kann man neue Logdaten einfach durch Betätigen eines Update-Buttons analysieren und die Ergebnisse den vorhandenen Berichten hinzufügen.

Die großen Log-Dateien lassen sich  glücklicherweise mit einem Kompressionsfaktor von bis zu 90 Prozent komprimieren. Während viele Logfile-Analysatoren die Daten vor der Verarbeitung dekomprimieren und danach wieder zusammenpacken müssen, kann NetTracker die komprimierten Daten direkt verarbeiten und somit viel Zeit und Festplattenplatz einsparen.

NetTracker ist verfügbar für Windows-, Macintosh- und UNIX-Umgebungen (FreeBSD, Solaris, Linux, AIX, HP-UX, etc). Die Software kann neben den Logfile-Formaten verschiedener Webserver, die Logfiles von Streaming Media Servern, Proxy Servern, Firewalls und FTP-Servern analysieren und deren Inhalte zu einheitlichen Reports vereinen. Viele Analysen, wie die Top-Ten der abgerufenen Seiten, der treuesten Besucher oder der häufigsten Verweise können mittels integrierter Standardroutinen quasi auf Knopfdruck erstellt werden. Aber auch beliebig andere, kundenspezifischen Übersichten lassen sich leicht mithilfe der mitgelieferten NetTracker-Wizards und -templates erstellen.

GUI NetTracker 

Bild 3: Die intuitive Bediener-Oberfläche von NetTracker (Quelle: Sane Solutions)

 

Autor

Der Autor Dipl. Inform. Klaus Eppele ist Inhaber der Firma improve marketing-training-consulting, Karlsruhe, www.improve-mtc.de.

improve
marketing-training-consulting
Dipl. Inform. Klaus Eppele
Heinrich-Weitz-Str. 31
76228 Karlsruhe
Tel: 07 21 / 94 74 621
Fax: 07 21 / 94 74 622
eMail:
eppele@improve-mtc.de
URL:
http://www.improve-mtc.de

Erschien in der Datacom 07/02, Seiten 38 - 40