Datenbank mal anders – eine BigQuery Starthilfe

BigQuery ist in aller Munde. Aber was ist es? Wie benutzt man es? Und vor allem wie teuer ist es und wer braucht es eigentlich? Um direkt mit BigQuery zu starten, fassen wir nachfolgend die wichtigsten Informationen zusammen.

Was ist BigQuery?

BigQuery ist eine cloudbasierte Datenbank aus dem Hause Google. In dieser kann man verschiedenste Datensätze speichern, verknüpfen, aufrufen und abfragen. Dabei ist die Datenbank aufgrund verschiedenster Logiken und Entwicklungen seitens Googles sehr performant. Selbst größere Datenmengen können binnen Sekunden abgefragt und prozessiert werden. An dieser Stelle wollen wir uns jedoch nicht allzu sehr in technischen Details verlieren, sondern einem anderen großen Vorteil von Google BigQuery Tribut zollen. Denn jeder mit einem Google Account und etwas SQL Kenntnissen kann das Tool nutzen. Im Gegensatz zu anderen Datenbanken benötigt man keine Ressourcen, um das System zu verwalten oder die Rechenressourcen zu dimensionieren. Ganz im Gegenteil: Über den Link kann BigQuery von jedem Ort mit einer Internetverbindung aufgerufen werden. Die Frage, wie das Tool von wem mit welcher Absicht bedient wird, liegt natürlich in unserer Hand – um alles andere kümmert sich Google.

Wie teuer ist es?

Den Vorteil der nicht nötigen Datenbankverwaltung und -skalierung lässt Google sich natürlich bezahlen. Hier halten sich die Kosten allerdings in Grenzen.

Um sich anfangs mit dem Tool auseinander setzen zu können, bietet Google einen Testaccount mit großzügigen Konditionen an. Mit einem freien Budget von 300$ lassen sich einige Terabytes an Daten abfragen und speichern.

Zudem ist der Account nicht nur auf BigQuery limitiert, sondern umfasst auch andere Google Cloud Platform Produkte. Sollte dieser Freibetrag tatsächlich irgendwann aufgebraucht sein, greifen folgende Preise:

  • Speicherung von Daten:
    • 0,02$ pro GB pro Monat (die ersten 10 GB im Monat sind kostenlos)
  • Abfragen von Daten:
    • 5$ pro 1 TB (das erste TB ist pro Monat kostenlos)

Dabei ist es wichtig zu wissen, dass das Tool nur erfolgreiche Abfragen berechnet. Sollte die Abfrage einen Fehler auswerfen, berechnet Google keinen Cent.

Alles in allem heißt das, dass sich die Kosten bei kleineren Datenmengen in einem überschaubaren Rahmen bewegen und keinesfalls im Verhältnis dazu stehen, was ausgegeben werden müsste, um die gleiche Qualität mit einer eigenen Datenbank zu bewerkstelligen. Für Firmen mit größerem Datenvolumen bietet Google zudem Pauschalpreise an.

Details zu den Preisen findest Du hier.

Hinzu kommt, dass es mehrere Sicherheitsmechanismen gibt, die ein Überschreiten des Budgets verhindern. Details dazu findest Du hier.

Wie benutzt man es?

BigQuery enthält ein integriertes Abfragemodul, in dem die Abfragen direkt gestellt und die Daten entsprechend ausgegeben werden können.

Abfragen werden mit Hilfe von SQL geschrieben. Es existiert sowohl der ältere “Legacy SQL” Dialekt, der eine Google spezifische Adaption des normalen SQL ist, als auch der im Juni 2016 eingeführte “Standard SQL” Dialekt.

Die von Google offiziell bevorzugte Abfragesyntax ist mittlerweile Standard SQL. Der Legacy SQL Dialekt ist ein Relikt aus Anfangszeiten, der zwar noch unterstützt aber nicht mehr empfohlen wird.

BigQuery Editor

Quelle: Integriertes Abfragefenster mit beispielhafter Standard SQL Query und Ergebnistabelle 

 

Wer braucht BigQuery? Und wofür?

Fälschlicherweise wird BigQuery oft nur im Zusammenhang mit Google Analytics gesehen.

Häufig wird es als eine Art Feature von Google Analytics 360 verstanden – damit wird man dem Tool allerdings nicht gerecht.

BigQuery ist eine eigenständige Datenbank. Diese bringt durch die sehr einfach umzusetzende Verbindung zu Google Analytics einen großen Vorteil in der Analyse der Google Analytics Daten mit sich. Doch zusätzlich kann sie noch eine Menge weiterer Vorteile vorweisen.

Der Data Lake ist in aller Munde – BigQuery ist hier eine mögliche Alternative mehrere Datenquellen zusammenzuführen und sie zentral zu speichern.

Verschiedene Datensätze können im Tool gespeichert und über einfache JOIN Abfragen miteinander verknüpft werden. Wie man es von Google gewohnt ist, ist die Verknüpfung mit hauseigenen Programmen sehr einfach gestaltet – beispielsweise bietet es einen Data Transfer Service für Google Ads, den Campaign Manager oder auch YouTube an.

Ein großer Vorteil ist zudem, dass Datensätze, die im Google Cloud Storage, in Cloud BigTable oder auch in Google Drive gespeichert wurden, abgefragt werden können. Ohne, dass diese dupliziert und als weiterer Datensatz innerhalb von BigQuery abgelegt werden müssen.

Die Ergebnistabelle kann dann wiederum als Basis für ein Reporting dienen, das mehrere Datenquellen darstellt. Alle gängigen Visualisierungs-Tools verfügen mittlerweile über eine vordefinierte Schnittstelle zu BigQuery, über die die Daten kinderleicht und ohne Programmierkenntnisse ihren Weg in das entsprechende Tool finden.

Wer sollte BigQuery nutzen?

Alle, die möglichst heute noch in das Datenbankthema einsteigen, aber kein großes Budget in die Hand nehmen wollen, um eine eigene Datenbank aufzubauen, sind bei BigQuery richtig aufgehoben. Durch die einfache Bedienung lässt sich der Fokus auf die Abfrage, Verknüpfung und Analyse der Daten richten.

Vorteile bietet das Tool auch als zusätzliche Datenbank, um vorhandene Datenquellen wie zum Beispiel Google Analytics, Google Ads & Co. zu verknüpfen oder mit anderen Daten aus dem Data Warehouse anzureichern. Durch den Vorteil, dass es – bis auf die sehr geringen Kosten der Speicherung – keine laufenden Kosten gibt, eignet sich das Tool sehr gut als Zweit-Datenbank.

Für alle Google Analytics 360 Nutzer bietet BigQuery außerdem den Vorteil, dass Limitationen, die im Interface vorhanden sind, umgangen und größere Mengen an Daten abfragt und verarbeitet werden können.

Mit Google Analytics 4 bietet sich zudem erstmals auch für die Nutzer der kostenlosen Variante die Möglichkeit, die Google Analytics Daten zu BigQuery zu exportieren.

Insgesamt hat Google mit BigQuery eine sehr gute Alternative zu anderen Datenbanken geschaffen. Dabei ist die Einstiegsschwelle sehr niedrig und die Kosten verhältnismäßig gering. Sowohl für Datenbankanfänger als auch für Fortgeschrittene bietet BigQuery das richtige Setup. Außerdem kann dies mit der Anbindung zu zahlreichen anderen Produkten ein Einstieg in die Welt der Google Cloud sein.

Ist dieses Thema für Ihr Unternehmen interessant oder haben Sie weitere Fragen zu BigQuery, der Google Cloud oder Google Analytics 4? Dann melden Sie sich gerne direkt bei uns.