Eines der wohl am häufigsten gewählten Visualisierungstools im Google Analytics Umfeld ist Looker Studio (ehemals: Google Data Studio). Das (kostenlose) Tool aus dem Google Universum zielt grundlegend darauf ab, Endanwendern wie z.B. Führungskräften oder Managern verfügbare Informationen so aufzubereiten, dass Geschäftsentscheidungen datengetrieben getroffen werden können. Looker Studio kann einerseits genutzt werden, um Daten von verschiedensten Quellen zu bearbeiten und andererseits, um Daten zu visualisieren.
Datenquellen werden hierbei über einen sogenannten „Connector“ angebunden. Dabei handelt es sich um ein Interface, das grundsätzlich eine einfache Integration ermöglicht. Der Google Analytics Connector von Looker Studio nutzt das Google Analytics 4 – Analytics Data API (Application Programming Interface). Die jüngst eingeführten Analytics API Quotalimits führen allerdings bei starker Nutzung des Tools zu Einschränkungen in der Datenvisualisierung (s. Blogbeitrag Looker Studio & GA4: Quotas – Fakten & Tipps zur erfolgreichen Datenintegration). Eine Möglichkeit diese Limitation zu überwinden, ist die Visualisierung von Google Analytics 4 (GA4) Daten in Looker Studio über eine BigQuery Anbindung.
Um den Überblick über wichtige Updates zu behalten, liefern wir euch im e-dynamics Blog einige wichtige Fakten und (Experten-)Tipps zur erfolgreichen Integration eurer GA4 Daten in Looker Studio. In diesem Beitrag zeigen wir euch, welche Informationen ihr benötigt, um das Reporting auf einer BigQuery Anbindung aufzubauen und Looker Studio weiterhin kostenfrei und intensiv nutzen zu können.
Export von GA4 Daten zu BigQuery
Um GA4 Daten in Looker Studio über eine BigQuery Anbindung darstellen zu können, müssen die GA4 Daten zunächst zu BigQuery exportiert werden. Danach kann Looker Studio direkt mit BigQuery verknüpft werden.
Wie verknüpfe ich GA4 mit BigQuery?
Schritt 1:
Aktivierung der BigQuery API über die Google Cloud Platform (GCP) & Erstellung eines Google Cloud Platform Projekts. Das Projekt wird bei der Aktivierung der API automatisch erstellt, sofern noch keins vorhanden ist. Eine detaillierte Anleitung hierzu findet ihr hier.
Schritt 2:
Verknüpfung von BigQuery und GA4 über das GA4 Interface: Dies funktioniert über GA4 > Verwaltung / Admin > Produktverknüpfungen (Property Spalte)
⚠️ Achtung: Im Laufe der Anlage muss der Speicherort der Daten gewählt werden. Unsere Empfehlung ist hier, einen geografisch nahen Speicherort in der EU (gilt natürlich nur für EU Unternehmen) zu wählen und diesen auch für zukünftige Datasets beizubehalten, da es sonst zu Problemen bei Datenverknüpfungen kommen könnte.
💡 Hinweis: Für größere Unternehmen mit potenziell mehr als einem GCP Projekt und / oder BigQuery Verknüpfung empfiehlt es sich, eine Organisation anzulegen, die ermöglicht, die GCP Produkte zentral zu steuern.
Welche Kosten kommen auf mich zu?
Um die Verknüpfung zunächst einmal zu testen, legen wir euch die sogenannte BigQuery Sandbox mit einem Free Trial Angebot für 90 Tage und 300$ Guthaben ans Herz. Die BigQuery Sandbox beinhaltet:
- 10 GB „active storage“ und 1 TB verarbeitete Abfragedaten pro Monat
- 1 GB „BigQuery BI Engine“ Kapazität
Zum Testen und ersten Kennenlernen des Tools reicht das Datenvolumen absolut aus. Entscheidet ihr euch nach der 90-tägigen Testperiode, BigQuery weiterhin nutzen zu wollen, greifen an der Stelle die standardmäßigen BigQuery Preismodelle.
Die Analysepreise, sprich die Preise für die Datenabfragen, belaufen sich nach dem Trial auf 5$ per TB, wobei das erste TB kostenlos zur Verfügung gestellt wird. Für die Speicherung der Daten sind sogar 10GB pro Monat kostenlos, danach zahlt man 0,02$ pro GB Speicherplatz. Für den „longterm storage“, d.h. keine Nutzung der Daten in den letzten 90 Tagen, ist sogar nur der halbe Preis fällig. Die Kostentreiber sind demnach ganz eindeutig die Datenabfragen und weniger die Speicherung der Daten. Bei jeder Abfrage, u.a. auch über die Looker API, z.B. bei standardmäßigen Filteranpassungen, wird bereits eine Abfrage berechnet.
⚠️ Hinweis: BiqQuery nimmt am 5. Juli 2023 Preisanpassungen vor. Die monatlichen Pauschalpreise und Flex-Slots werden in neue Preise umgewandelt und die jährlichen Pauschalpreise werden zum Zeitpunkt der Verlängerung in die Preise der Versionen konvertiert. Mehr Infos
Beispielhafte Kostenkalkulation
Um die Kosten etwas greifbarer zu machen, findet ihr nachfolgend einmal eine beispielhafte Kostenkalkulation anhand eines fiktiven Online Shops:
Nehmen wir an, unser Online Shop mit ca. 15 000 täglichen Pageviews benötigt dafür entsprechend etwa 35 MB BigQuery Speicherplatz pro Tag.
- Speicherung: Bis das monatliche Freibudget von 10 GB aufgebraucht ist, können ca. 285 Tage an Daten gespeichert werden.
- Abfragen: Bis das monatliche Freibudget von 5$ aufgebraucht ist, können ca. 80 Abfragen aller Daten des letzten Jahres erfolgen
Verknüpfung von Looker Studio und BigQuery
Die Verknüpfung von Looker Studio und BigQuery erfolgt relativ simpel über einen vorgefertigten „Data Connector“ in Looker Studio. Dieser sieht wie folgt aus:

Im Hinblick auf die Verknüpfung der Daten gibt es mehrere Möglichkeiten, die je nach Anforderung an das Dashboard und an die Nutzung gegeneinander abgewogen werden sollten.
Anbindungsmöglichkeiten
Grundsätzlich gibt es viele Varianten und Kombinationen. Wir stellen euch drei gängige Herangehensweisen vor.
- Direkte Verknüpfung – nicht empfohlen, da kostenintensiv & umständlich
Bei einer direkten Verknüpfung wird die Datentabelle des BigQuery GA4 Exports direkt mit Looker Studio verknüpft. Zum einen wird bei jeder Abfrage teils der komplette Datensatz abgefragt (kostenintensiv), zum anderen liefert die Datentabelle bei direkter Anbindung keine gängigen Metriken wie „Pageviews“, „Visits“, „Bounces“, etc.. Die Daten sind noch nicht in der Weise formatiert, wie es für die Visualisierung oftmals sinnvoll ist, was das Ganze sehr umständlich macht. - Custom Table – kostengünstig, aber Achtung bei aufsummierten Werten
Eine gängige Alternative ist, zunächst in BigQuery eine Datentabelle anzulegen, die genau die Daten beinhaltet, die für den Report benötigt werden. Das hat zum einen den Vorteil, dass die abgefragte Datenmenge deutlich geringer ist und zum anderen, dass die Daten bereits in der Art und Weise formatiert werden können, die eine Visualisierung innerhalb von Looker Studio ohne viel Aufwand möglich macht. Achtung ist hier allerdings bei „vorgruppierten Daten“ geboten. Sobald Daten, wie z.B. die Anzahl der User, auf Tagesbasis ausgegeben werden, können sie nicht immer ohne Weiteres weiter aggregiert werden (z.B. User auf Monatsebene), da an der Stelle eine ID zur „Deduplizierung“ fehlt. Beispiel: Nehmen wir an, es gibt einen User, der jeden Tag die Website besucht. Die Tabelle auf Tagesbasis würde dann wie folgt aussehen:
Tag | User |
---|---|
Tag 1 | 1 |
Tag 2 | 1 |
Tag 3 | 1 |
Tag 4 | 1 |
… | … |
Tag 31 | 1 |
Würden auf Basis dieser Tabelle die Daten in Looker Studio auf Monatsebene und nicht auf Tagesebene ausgegeben werden, würden insgesamt 31 User für den Monat gezählt werden. Dabei handelte es sich tatsächlich nur um einen, wiederkehrenden User.
- Custom Table & Custom Query
Eine weitere Möglichkeit, dem Problem zu begegnen, ist eine Kombination aus Custom Table und Custom Query. Eine Custom Query bezeichnet die Option, innerhalb von Looker Studio SQL Abfragen zu hinterlegen, die auf eine Tabelle innerhalb von BigQuery zurückgreifen. So kann beispielweise in BigQuery eine Tabelle angelegt werden, die nur die Daten enthält, die für den Report relevant sind, gleichzeitig allerdings auch „Identifier“ beinhaltet, die eine Deduplizierung der Daten ermöglichen. Dies bedeutet, dass die Daten z.B. auf Sessionebene ausgegeben werden, sprich, die Session ID ist in der BigQuery Tabelle noch vorhanden. Die Custom Query innerhalb von Looker Studio greift dann auf diese Tabelle zurück und kann die Daten je nach benötigtem Aggregationslevel zusammenfassen. Zusätzlich bietet die Custom Query Funktion den Vorteil, dass auf den Cache zurückgegriffen werden kann, was bedeutet, dass das Ergebnis einer Abfrage zwischengespeichert und bei gleicher Abfrage aus dem Cache geladen wird. In diesem Fall fallen keine Abfragekosten an.
Je nach Anwendungsfall bieten sich noch weitere Optionen zur Dashboard Performance sowie zur Tabellen Optimierung an, wie z.B. durch partitionierte Tabellen oder BI Engine. Bleibt mit dem e-dynamics Blog zu allen neuesten Expertentipps & -tricks im Analytics Universum up-to-date!
Gerne beraten wir bei den Möglichkeiten zum Einsatz von BigQuery & Looker Studio sowie bei der Migration zu GA4 in eurem Unternehmen. Sprecht uns an!
Feedback
Wir freuen uns über Feedback und weiteren Austausch zu BigQuery, Looker Studio und Google Analytics 4.