Aufgrund des Artikels „Sechs Gründe gegen Google Analytics“ war es nötig, eine Alternative zu Analytics für den eigenen Webspace zu testen. Robert empfahl in den Kommentaren das OpenSource System Piwik, das ich nun installiert und getestet habe.
Mein erster Eindruck: Klasse! Im Vergleich zu den üblichen Serverstats erhält man schön aufbereitete Statistiken, die man im Unterschied zu Google Analytics nicht zu Dritten senden muss. Hier noch ein paar Kniffe und Infos.
Installation
Piwik läuft nur ab PHP5. Standardmäßig ist bei Hoster wie all-inkl.de aber PHP4 aktiv, obwohl auch PHP5 installiert ist. Hier hilft ein Eintrag in der .htaccess im Verzeichnis, in dem Piwik installiert ist:
AddHandler php5-cgi .php
Ab dann kann die Installation von Piwik problemlos starten. Wenn nicht, steht PHP5 vermutlich nicht zur Verfügung und man darf sich an den Support wenden. Der Installationsprozess an sich ist einfach, man wird modern und nett durchgeleitet. Die Angaben zur MySQL-Datenbank sollten natürlich zur Hand sein 🙂
Integration von Piwik
Zur Integration muss auf allen Seiten eines Projektes ein JavaScript-Code integriert werden. Im Vergleich zu Google leider etwas länger geraten, dafür kürzer als beim kostenpflichtigen eTracker. Wer ein CMS wie Joomla! einsetzt, hat den Code in wenigen Sekunden integriert (Template > index.php irgendwo ganz weit unten), bei statischen Webseiten freut sich, wer mittels modularem PHP eine footer.php geschaffen hat. Ansonsten hilft nur „Suchen/Ersetzen“ via Phase5 oder anderem Editor.
Ein Piwik für alle
Genial ist unter anderem die Möglichkeit, mit einer einzigen Installation viele Projekte zu tracken. Im Admin-Bereich kann man unter „Site“ diese Projekte verwalten. Bei mir werden derzeit zehn eigene Projekte voll mitgetrackt – jede hat ihren eigenen JavaScript-Code. Diese Projekte müssen nicht auf einem einzigen Server liegen. Wieviel da an Traffic etc. zusammenkommt, werde ich verfolgen. Doch habe ich in der Vergangenheit manche Serverstats vernachlässigt, weil das stete Aufrufen unterschiedlicher URLs und Eingabe verschiedener Passwörter nervig war. Jetzt macht das Stöbern wieder richtig Spaß.
Piwik für Kunden?
Eine der Probleme beim Einsatz von Analytics ist die Ãœbertragung der Daten an Dritte. Vor allem an einen Dritten, der die gebetsmühlenhafte Wiederholung des Satzes „Wir sind nicht böse“ in der Regel als ausreichende Erklärung in Sachen Datenschutz anzusehen scheint.
Interessant wäre nun eine Antwort die Frage, ob man die Webseiten von Kunden mit Piwik tracken darf. Ist man ein Dritter wie Google? Oder aus dem Schneider, da man nicht – wie Google – Beziehungen zwischen Datenquellen (getrackte IPs, Logins bei Google Diensten) herstellen kann? Als Webmaster hat man sowieso Einblick in die Daten – und könnte seinen Kunden mittels Piwik einen schönen Mehrwert bieten.
Denn ebenfalls sehr praktisch ist es – neben Dingen wie API und Pluginfähigkeit – dass man verschiedene User mit unterschiedlichen Rechte einrichten kann. So kann ich Frau X erlauben, die ausführlichen Besucherstatistiken ihrer Seite xyz.de zu verfolgen. Oder Herrn Y, bestimmten Einblick in mehrere Seitenstats zu haben. Richtig nett.
Sicherheitsbedenken
Man muss piwik nicht unter /domain.de/piwik/ installieren, sondern kann die Bezeichnung des Ordners frei wählen. Dies kann schon mal der ein oder anderen Suche nach Installationen durch Hacker vorbeugen. Doch leider ist der Installationsort im Quellcode der getrackten Seiten erkennbar. Eine zusätzliche Absicherung des Installationsordners durch .htpasswd bringt nichts, da dann keine Daten ankommen dürften, wenn JavaScript nach Hause telefonieren will.
Hier hilft also nur der beständige Blick nach Updates. Da man nur eine Piwik-Installation braucht, hält sich der Aufwand für Updates glücklicherweise in Grenzen.
Die einzigen Probleme, die bislang auftauchten, waren Fehlermeldungen beim Durchklicken von Piwik. Ein erneuter Aufruf gelang dann aber immer:
session_start() [function.session-start]: ps_files_cleanup_dir: opendir(/tmp) failed: Permission denied (13)Â in ‚/www/htdocs/…/index.php‘ at the line 46
Fazit
Kurz und gut: Wer nicht auf die Verzahnung von Google AdWords mit Google Analytics angewiesen ist, sollte Piwik unbedingt als Alternative zu Analytics und Serverstatistiken ins Auge fassen! Hier geht es zum Download: http://piwik.org
Ich habe Piwik mittlerweile auch auf ein paar Projekten im Einsatz und bin recht angetan davon. Allerdings sollte man am MySQL-Tabellenlayout noch dringend Hand anlegen, da dort die Indizes zu sparsam gesetzt sind und, da dadurch zwangsweise immer die gesamte Tabelle durchsucht werden muss, nach einer Weile dadurch die Serverlast extrem ansteigt und Piwik sehr langsam wird.
Diese beiden Änderungen haben schon viel gebracht: Der Load-Wert sank von 36 (!!!) auf <=1.
Tabelle piwik_log_action: index hinzugefügt über name, type
Tabelle piwik_log_visit: index „index_visit_server_date“ erweitert auf:
visit_server_date, idsite, config_md5config
Klingt gut. Hast du es als Verbesesserungsvorschlag eingereicht?
Noch nicht. Wir haben Piwik derzeit in der Firma unter Hochlastbedingungen (rund 1 Mio. Aufrufe/Tag) im Test und ich schaue mal, was sich diesbezüglich eventuell noch verbessern ließe.
Kleines Update: Mittlerweile habe ich mich mit dem/einem der Entwickler per Mail ausgetauscht. Zudem habe ich die Speicherengine der Haupttabellen auf InnoDB geändert, um dem hohen Aufkommen von INSERT-Operationen gerecht zu werden (Zeilenbasiertes Locking vs. Tabellen-Locking).
Kann also sein, dass es demnächst ein Update gibt. 🙂
Danke, Banger! Ich hab Piwik mittlerweile auf einen eigenen Server gelegt. Bei ca. zehn Webprojekten, die damit getrackt werden, sind in knapp drei Monaten schon locker 70 MB in der Datenbank zusammengekommen.
Momentan nutze ich PHP Web Stat und AccessInfo zur Auswertung der Webserver-Logfiles. Aber Piwik werde ich im Januar auf jeden Fall mal installieren, Google braucht nicht mehr Informationen als unbedingt nötig.
[…] mir sind keinerlei Probleme mit der Erreichbarkeit aufgefallen. Zudem läuft auf dem Server Piwik, das derzeit ein Dutzend Projekte auswertet, also auch einiges an Traffic und Performance zieht. […]
@wolke23:
Bei mir waren es über 100 MB an Daten nach nicht einmla dem ersten ganzen Tag mit diversen meiner Websites.
Innerhalb kurzer Zeit habe ich Piwik liebgewonnen und setze es auch für Kunden ein.
Klar ist man selbst auch ein Dritter, so lange es bei der getrackten Website nicht um ein eigenes Projekt handelt. Es ist auch nur fair und richtig User darüber zu informieren, dass Daten erfasst, protokolliert, ausgewertet aber nicht rausgegeben werden. Bei Goolge & Co. hat man diese Wahl ja nicht. Man muss blind drauf vertrauen..
Nutze seit langer Zeit Google Analytics und würde gern auf Piwik umstellen. Nur das Problem, mein Webhoster ist Strato. Der zweitgrößte Webhoster Europas lässt die benötigte pdo_mysql Extensions nicht zu, nur pdo_sqlite. Piwik für mich zur zeit leider nicht nutzbar.
Nun da du festgestellt hast, dass dein Hoster nichts taugt, kannst du ja auch gleich Nägel mit Köpfen machen und gleichzeitig zwei unliebsame Große in die Wüste schicken.
Ist ja nicht so als wenn es keine Alternativen gäbe..
Wie lange braucht man um Piwik auf einer Standard Webseite ( ca 10 Seiten ) zu installieren ?
Es ist ziemlich egal, ob es 10 oder 100 oder 1000 Seiten sind (außer, man würde große Seiten statisch aufsetzen, was heutzutage aber keiner mehr macht). Die Arbeit ist immer dieselbe: Piwik installieren, Code integrieren. Wenn ich das für einen Kunden machen würde, würde ich mit ca. einer Stunde rechnen, wobei ein gewisser Teil davon Kommunikations- und Einrichtungsaufwand (Zugänge FTP/MySQL) wäre.