Viele Unternehmen haben sich in den letzten Jahren dazu entschieden auf Google Analytics umzusteigen, um den Traffic auf ihrer Webseite zu tracken. Dadurch werden Unmengen an Daten gesammelt, womit viele Insights generiert werden können. Hierbei wird gerne von Big Data gesprochen. Meist reichen die Tools, die von Google angeboten werden, nicht aus, um diese Daten optimal analysieren zu können. Wir Data Analysten bei e-dynamics haben uns unter anderem auf die Programmiersprache R spezialisiert. In diesem Blogeintrag stellen wir R vor und gehen dabei vor allem auf die Anbindung mit Google Analytics ein.

Was ist R?

R ist eine freie Programmiersprache, die in erster Linie für statistische Verfahren, Berechnungen und Grafiken erstellt wurde. An der Entwicklung/Weiterentwicklung der Programmiersprache kann sich die ganze Community beteiligen, weshalb Neuerungen in der Data Analytics Branche meist frühzeitig zur Verfügung stehen. Dabei kommen sogenannte R-Pakete zum Einsatz. R Pakete sind eine Ansammlung von Funktionen, Befehlen und Datensätzen, die von der Community entwickelt werden, sodass diese in R geladen und benutzt werden können, um die Möglichkeiten und Anwendungen in R zu erweitern. R ist insbesondere unter Mathematikern, für statistische Auswertungen und der Visualisierung von Daten, sehr beliebt.

Anbindung von Google Analytics mit R

Um R mit Google Analytics verbinden zu können, muss zuerst ein benötigtes Paket in R installiert und geladen werden. Wir haben uns für das Paket googleAnalyticsR entschieden. Im Folgenden werden die Schritte zur Einrichtung des Pakets vorgestellt. Nachdem das Paket installiert und in R geladen wurde, muss der Befehl ga_auth() ausgeführt werden. Es wird gefragt, ob die Verbindung gewünscht ist. Um dies zu bejahen muss in der unteren Konsole 1 eingegeben werden. Anschließend öffnet sich im Browser ein Fenster, wobei man sich mit seinem Google Account einloggen und die entsprechenden Berechtigungen akzeptieren muss. Ein Token wird erstellt, welches wiederum in der R Konsole eingegeben werden muss. Nun ist R mit Google Analytics verbunden und das Ziehen und Analysieren der Daten kann beginnen!

Ein Beispiel für die Anbindung von Google Analytics mit R

Google Analytics mit R

Nachdem die Verbindung hergestellt wurde, muss die View, aus der die Daten geladen werden soll, ausgewählt werden. Diese View wird in dem obigen Beispiel unter ga_id abgespeichert. Anschließend kann mit dem Befehl google_analytics Daten aus der View geladen werden. Dabei gibt es viele Möglichkeiten die benötigten Daten zu filtern. Wir lassen uns in dem obigen Beispiel auf Tagesbasis maximal 10 Zeilen der Sessions vom 01.01.2019 bis zum 01.03.2019 ausgeben. Dabei haben wir die Standard Metriken und Dimensionen aus Google Analytics ausgewählt. Falls benutzerdefinierte Metriken beziehungsweise Dimensionen angelegt wurden, müssen die genauen Namen aus Google Analytics entnommen werden.

Ein großes Problem stellt das Sampling der Daten dar, falls große Mengen an Daten direkt aus Google Analytics gezogen werden. Das vorgestellte Paket überprüft daher stets im Vornherein, ob ein Sampling vorliegt und wendet nötigenfalls ein Anti-Sampling an, welches zuverlässig funktioniert.

Sind die Daten in R geladen, können verschiedene Analysen angewandt werden, dazu müssen die erforderlichen Pakete installiert sein. Wir benutzen unter anderem das Paket Shiny, um anschließend aus der Analyse eine Anwedung zu erstellen, sodass auch andere Kunden bzw. Kollegen die Analysen einfach und unkompliziert nutzen können. Diese Anwendungen werden Apps genannt. Im Folgenden eine unserer Apps zur Regressionsanalyse.

Regressions App

Warum die Anbindung mit R?

Wie schon oben beschrieben, bieten viele Tools keine oder nur kostenpflichtige Möglichkeiten für komplexe und rechenaufwendige Analysen. Wir richten den Fokus auf angepasste mathematisch statistische Anwendungen. Dazu betreiben wir unter anderem Regressionsanalysen und Predictive Analysis, wenden Methoden wie Holt-Winters, Markov-Ketten oder den Prophet-Algorithmus an. Durch die Möglichkeit unsere R-Anwendungen direkt mit den Daten aus Google Analytics zu verknüpfen, konnten wir unsere Analysen effizient gestalten und viel Zeit und Arbeit mit manuellen Datentransfers sparen.

Das Team von e-dynamics ist zurzeit darauf hinaus zu jeder Analyse bzw. zu jedem Problem eine App-orientierte Lösung zu finden. Sobald die Datenanbindung steht, erstellen wir mittels Shiny eine App, die es uns ermöglicht die Analysen ansprechend zu visualisieren und die wichtigsten Insights hervorzuheben.

Eine App zur Regressionsanalyse haben wir oben vorgestellt. Ein weiteres Thema, welches uns in den letzten Jahren immer wieder begegnet ist, und vor allem in der Pandemie an Dringlichkeit dazu gewonnen hat, ist die Anomaly Detection.

Anomaly Detection App

Bei e-dynamics sind wir auf dem aktuellsten Stand und arbeiten an einer eigenen Lösung zu dem Thema! Demnächst gibt es dazu mehr in unserem Blog.

Ist dieses Thema für Ihr Unternehmen interessant oder haben Sie weitere Fragen zu Google Analytics mit R? Dann melden Sie sich gerne direkt bei uns.