ubuntuusers.de

Projektvorstellung: Freie Webanalytik mit Piwik

projektvorstellung.png

Piwik ist eine in PHP geschriebene freie Webanalytik-Software und soll eine Alternative zu Google Analytics sein. Die GPL v3 lizenzierte Software wird auf mehr als 150 000 Webseiten eingesetzt und ist in über 40 Landessprachen erhältlich.

Piwik-logo.png
Piwik-Logo

Der Betreiber einer Webseite braucht, unter anderem um zu wissen, wie seine Seite ankommt, einiges an Daten. Hierzu wird eine Webanalytik-Software eingesetzt. So ist es möglich, Daten über das Verhalten der Webseitenbesucher zu erfahren. Neben der Häufigkeit und der Dauer eines Webseitenbesuches werden auch die IP-Adresse und die Herkunft des Besuchers gespeichert. Das für diesen Zweck wohl bekannteste, umfangreichste und das am weitesten verbreitete Instrument ist wohl Google Analytics. Der große Nachteil des Programms liegt jedoch darin, dass alle Daten direkt an die Google Server übermittelt und auch dort verarbeitet werden. Als Alternative bietet sich hier die unter der GPL v3 Lizenz stehende Open Source Software Piwik an. Auch Piwik sammelt einiges an Daten, aber im Gegensatz zu Google Analytics werden diese nicht zentral gespeichert, sondern nur auf dem Server bzw. in der Webseite, auf dem Piwik installiert ist.

Übersicht

piwik-uebersicht.png
Übersichtsseite von Piwik

Piwik unterteilt die Bedienoberfläche in „Besucher“, „Aktionen“, „Verweise“ und „Ziele“. Auf jeder Unterseite lassen sich die Daten der beobachteten Webseite für einen speziell ausgewählten Zeitraum erfassen. So kann man die Statistiken zu jedem einzelnen Tag, Monat und Jahr getrennt aufrufen. Neben diesen vordefinierten Zeiträumen kann man auch einen eigenen Zeitraum erstellen.

Die Übersichtsseite, welche auch gleichzeitig die Startseite ist, ist in drei Spalten gegliedert, in denen die wichtigsten Widgets liegen. Standardmäßig werden dort unter anderem die Statistiken zu den letzten Besuchern, Referrer-Webseiten und die Besucher-Browser angezeigt. Der Administrator kann die Widgets nach seinen eigenem Belieben anpassen, sie löschen und neue hinzufügen. Außerdem lassen sie sich per Drag and Drop frei verschieben und neu anordnen.

Besucher

Piwik zeichnet sehr viele Informationen zu jedem einzelnen Besucher auf. Auf der Besucher-Übersichtsseite lässt sich die Benutzerentwicklung nachvollziehen. Es werden hier Zahlen zur durchschnittlichen Aufenthaltsdauer, die Absprungrate der Benutzer oder auch die Besucheranzahl angezeigt.

Das Besucher-Log zeigt genaue Informationen für jeden Besucher an. In der Tabelle wird neben der IP-Adresse, wenn es möglich ist, auch der Provider, von dem die Adresse bezogen wird und die sekundengenaue Uhrzeit angezeigt, zu der der Besucher die Seite besucht hat. Weiterhin geht aus der Tabelle hervor, aus welchem Land der Besucher kommt, welches Betriebssystem und welcher Browser genutzt wird. Piwik erkennt anhand von einem abgespeicherten Cookie, ob der Besucher die Webseite bereits besucht hat, oder ob es ein neuer Besucher ist, und markiert dies in den Statistiken in Form eines Symbols. Ebenso werden die verwendeten Browser-Plug-ins, wie Flash, PDF, Java oder QuickTime, erfasst und ausgewertet. Plug-ins von Besuchern, die den Internet Explorer verwenden, werden, mit der Ausnahme von Java, nicht gespeichert. Weitere Informationen, etwa über die Version des Betriebssystems und des verwendeten Browsers, sowie der genutzten Auflösung erscheinen in einem Mouse-Over über den dazugehörenden Symbolen.

Darüber hinaus merkt sich Piwik auch die „Herkunft“ des Besuchers, sofern die Referrer-Seite ermittelt werden konnte, ansonsten wird angezeigt, dass der Besucher direkt auf die Seite zugegriffen hat. Ergänzend ist es auch möglich zu sehen, was der Besucher genau auf der Webseite getan hat, welche Unterseiten er besucht hat, und wie lange er sich auf der gesamten Webseite aufgehalten hat. Zudem werden auch Downloads von Dokumenten wie Bildern aufgezeichnet.

Die weiteren Unterkategorien von „Besucher“ fassen einzelne Informationen thematisch zusammen. Unter „Standorte und Provider“ werden Graphen und Zahlen von Besuchern sortiert nach Kontinenten, Länder und Provider dargestellt. Im weiteren Punkt „Einstellungen“ werden die verwendeten Browser und Plug-ins aufgelistet, als auch die Betriebssysteme und die Bildschirmauflösungen. Das Datenmaterial wird teilweise in Kreisdiagrammen angezeigt, aber auch in Listen mit absoluten Werten und stellenweise Prozentwerten. Die Anzeigemethoden sind jedoch nicht fest definiert. Der Anwender kann nach eigenem Belieben zwischen den verschiedenen Ausgabeoptionen wie Tabellen und Diagrammen wechseln.

Neben diesen Informationen werden, wie bereits erwähnt, auch die Zeiten gespeichert, die ebenfalls noch mal getrennt in einem Diagramm visualisiert sind. Unter der Unterkategorie „Engagement“ wird unter anderem die durchschnittliche Aufenthaltsdauer auf der Webseite dargestellt, als auch die Menge der wiederkehrenden Besucher.

Nützlich sind besonders die zahlreichen Exportoptionen von Piwik. Sie ermöglicht das Exportieren eines Datensatzes als CSV, TSV, XML, als auch in Json, PHP und RSS.

Aktionen

In die Kategorie „Aktionen“ fallen alle Daten über die einzelnen Seiten. Unterteilt wird die Kategorie in „Seiten“, „Eingangsseiten“, „Ausstiegsseiten“, „Seitentitel“, „Ausgehende Verweise“ und „Downloads“. In der Unterkategorie „Seiten“ wird unter anderem dargestellt, welcher Teil der Webseite die meisten Seitenansichten hat, wie hoch die Absprung- und Ausstiegsrate ist und auch die durchschnittliche Verweildauer auf der Seite. In den „Eingangs-“ und „Ausstiegsseiten“ wird nun differenziert dargestellt, welche Einzelseite die Besucher zuerst öffnen, und bei welcher Einzelseite sie die Webseite wieder verlassen haben. Während bei „Seiten“ die Daten nach der Struktur und den Dateinamen der einzelnen Seiten geordnet sind, werden bei „Seitentitel“ die Titel der Einzelseiten aufgezählt und mit den gleichen Fakten veranschaulicht.

Mit den aufgezeichneten Daten unter „Ausgehende Verweise“ kann der Webseitenbetreiber leicht erkennen, an welchen Links die Besucher am häufigsten die Seite verlassen. Der letzte Unterpunkt unter „Aktionen“ ist der Bereich „Downloads“. Dort wird ziemlich simpel aufgelistet, welches Datenmaterial, wie oft heruntergeladen wurde.

Verweise, Ziele und weiteres

Die Kategorie „Verweise“ wertet hauptsächlich die Herkunft der Besucher aus. Unterteilt in „Suchmaschinen und Suchbegriffe“, sammelt Piwik die Anzahl der Besuche kategorisiert in die verschiedenen Suchmaschinen, zusätzlich wird auch noch erfasst, welche Suchbegriffe die Besucher verwendet haben, um auf die Webseite zu gelangen. Neben Besucher, die über Suchmaschinen auf die Seite gelangen, kommen diese ebenfalls von anderen Webseiten. Unter „Webseiten“ wird hier aufgezählt, welche Seiten im besonderen Maße die Besucher auf seine eigene Seite weiterleiten.

Weiterhin kann man eigene Statistiken unter „Ziele“ erstellen. Der Webseitenbetreiber kann so beispielsweise ein Ziel für die Registrierung von neuen Benutzern erstellen oder die Aufrufanzahl von „Bitte Lesen“ Post verfolgen.

Piwik bietet neben dem Webauftritt auch die Möglichkeit der E-Mail-Benachrichtigung an. Die Berichte lassen sich individuell gestalten und an mehrere Leute senden. Die einzelnen Datensätze lassen sich aktivieren und deaktivieren. So ist es möglich nur Teile der Daten an weitere Personen zu senden, während der Administrator selbst eine E-Mail mit vollständigen Datensätzen erhält.

Eigene Funktionen lassen sich mithilfe der API realisieren. Die bereits enthaltenen Funktionen sind als Plug-ins in Piwik eingebunden und lassen sich nach Bedarf an- und abschalten.

Datenschutz

Ein weiterer Punkt, den man bei der Webanalytik nicht außer Acht lassen darf, ist der Datenschutz. Problematisch ist hierbei die Erfassung Personen spezifischer Daten, wie beispielsweise der IP-Adresse, womit eine eindeutige Identifizierung möglich ist.

Piwik arbeitet aus diesem Grund mit dem Unabhängigen Landeszentrum für Datenschutz (kurz ULD) zusammen. Die angeregten Verbesserungen wurden bereits in der Version 1.2 eingepflegt. Das ULD hat ein Dokument veröffentlicht, in welchem Gründe genannt werden, wie man Piwik datenschutzrechtlich einwandfrei nutzen kann. Darunter fallen unter anderem die Anonymisierung von IP Adressen als auch die OptOut-Funktion.

Die OptOut-Funktion ermöglicht es den Besuchern entscheiden zu lassen, ob Piwik seine Daten speichern darf oder nicht. Standardmäßig werden die Daten jedoch automatisch gespeichert. Der Administrator kann mittels eines iframes dem Besucher die Möglichkeit geben der Speicherung seiner Daten zu widersprechen. Durch die Deaktivierung seitens des Besuchers wird dann das eindeutige Webanalyse-Cookie deaktiviert.

Neues in Piwik 1.5

Mit der neuen Version von Piwik kamen neben Fehlerkorrekturen und weiteren kleineren Änderungen auch neue Funktionen hinzu. Als neue Funktionen wurden unter anderem E-Commerce und benutzerdefinierte Variablen eingeführt. Des Weiteren wurde die Nutzung von Adobes Flash für die Anzeige von Graphen abgeschafft. Sie werden nun mittels einer Kombination aus Canvas und JavaScript erzeugt. Einzig für die Weltkarte der Besucher wird noch Flash benötigt.


Einen ausführlicheren Artikel zu Piwik gibt es in der Augustausgabe von freiesMagazin zu lesen.