Datenvisualisierung beschreibt die grafische Darstellung von Daten und Informationen. Die Visualisierung soll helfen, zugrundeliegende Daten, für Außenstehende schnell verständlich aufzuzeigen. Es ist eine gängige Methode um Trends, Ausreißer oder Muster in Daten festzustellen. Gerade in der Welt von Big Data ist die Datenvisualisierung wichtig, um daraus Handlungsempfehlungen ableiten zu können.

Welche Richtlinien sollten bei der Datenvisualisierung beachtet werden?

Zunächst ist es wichtig, dass sich Hintergrundwissen zu den Daten angeeignet werden muss. Du kannst die vorhandenen Daten nicht ansprechend visualisieren, wenn du sie nicht verstehst. Ein weiterer wichtiger Punkt ist die Frage nach dem Ursprung der Daten. Woher hast du die vorliegenden Daten? Schließlich können sie von einer Umfrage oder einer Datenbank kommen, aber auch automatisch oder manuell eingepflegt sein.

Der letzte wichtige Punkt ist die Frage nach dem Ziel. Was möchtest du mit deiner Datenvisualisierung erreichen?

Wie werden Daten am besten aufbereitet?

Ausgehend davon, dass die Daten in geeigneter Form vorliegen, musst du dich versichern, dass die Daten in einem geeigneten Zustand sind. Das heißt, gibt es Ausreißer, fehlende Angaben oder Verfälschungen? Sollte das der Fall sein, musst du wissen wie du damit umgehst. Eventuell musst du in diesem Fall die Daten weiter filtern, benötigst zusätzlich kalkulierte Metriken oder es sind Datentransformationen nötig.

Wenn du alle nötigen Daten vorliegen hast, kannst du diese visualisieren. Doch wen möchtest du damit erreichen? Die Zielgruppe sollte von vorne herein klar definiert sein. Es gilt auch zu unterscheiden in welchem Kontext die Visualisierung wahrgenommen wird. Beispielsweise wird bei einem Vortrag der Zuhörer an die Daten herangeführt und bekommt diese erklärt, wohingegen in einer Mail für den Leser gleich eindeutig erkennbar sein muss, was die visualisierten Daten aussagen. In diesem Zusammenhang sind auch 2 Vorgehensweisen zu beachten: Exploratory und Explanatory.

Exploratory lässt den User interaktiv in den Daten nach Thesen suchen (Dashboards) und Explanatory beschreibt ein gefundenes Ergebnis, meist als PDF- oder XLS-Datei.

Tipps & Tricks bei der Datenvisualisierung

Grundsätzlich gibt es keine festen Regeln, die besagen, welches Diagramm wann das Beste ist. Allerdings gibt es einige Tipps, die du beachten kannst. Diese wollen wir dir gerne vorstellen:

  • Pie Charts sind fast nie eine gute Wahl – Balkendiagramme hingegen sind meist die bessere Option.
  • Daran denken, wie der Betrachter die Frage auf den ersten Blick beantworten kann. Je weniger Zeit der Betrachter braucht, um die Information zu erhalten, desto besser.
  • Die Visualisierung sollte recht einfach gehalten sein – viele Tools fügen standardmäßig Informationen an, die nicht unbedingt notwendig sind (Gitternetzlinien, Datenbeschriftung, bunte Farbpalette).
  • Anstatt den Betrachter mit zu viel Informationen zu verunsichern, arbeite mit Farbe, Positionierungen, Hervorhebungen beziehungsweise lass bestimmte Dinge durch Ausrichtung in den Hintergrund rücken.
  • Darstellungsmethoden mit 3D-Effekten und Animationen wirken oft unprofessionell und lenken vom Wesentlichen ab
  • Es gibt viel Literatur, die bei der Wahl für eine Visualisierung helfen können, wie zum Beispiel von Cole Nussbaumer. Auf ihrem Blog „Storytelling with data“ sind weitere hilfreiche Tipps sowie Beispiele zu finden, wie Datenvisualisierung nicht umgesetzt werden sollte.
  • Eine gute Visualisierung ist nicht nur inhaltlich richtig, sondern auch optisch ansprechend („Denke wie ein Designer“). Das Corporate Design des Unternehmens solltest du dabei beachten.
  • Diagramme können lügen. Ein gutes Beispiel: eine besonders kleine Skale in einer Zeitreihe, um die Schwankungen größer aussehen zu lassen. Von daher passe auf, kein falsches Bild zu suggerieren.
  • Wenn es sich um größere Projekte handelt, versuche eine Geschichte mit den Visualisierungen zu erzählen. Dies verdeutlicht die Fragestellung und macht einen Vortrag interessant.

Tools zur Datenvisualisierung

Natürlich gibt es verschiedene Tools, die dich bei der Datenvisualisierung unterstützen können. Wir zeigen dir auf, welche du nutzen kannst und wo die Stärken des jeweiligen Tools liegen, damit du für dich abwiegen kannst, welches du nutzen kannst.

Excel (Standard Tool)

Das Standardtool mit einer großen Freiheit an Einstellungsmöglichkeiten. Fast alle Elemente können einzeln angesteuert und personalisiert werden. Allerdings ist Excel nicht für sehr große Datenmengen geeignet und Datentransformation nur bedingt möglich. Interaktive Dashboards sind auch nur mit sehr großem Aufwand möglich.

Qilk Sense (Interaktive Dashboards)

Mit diesem Tool sind sehr große Datenmengen und Transformationen einfach umsetzbar sowie interaktive Dashboards mit mehreren Seiten. Auch komplexere Fragestellungen können mit genügend Know-how des Tools umgesetzt werden. Für den Betrachter können die Daten durch schöne Dashboards erklärt werden. Allerdings muss der Ersteller des Dashboards über das nötige Fachwissen verfügen.

Ähnliche Tools sind: Tableau, Data Studio, Power Bi

R (Profitool)

Für dieses Tool sind riesige Datenmengen und anspruchsvolle statistische Analysen kein Problem. Mit frei verfügbaren Visualisierungspaketen (z.B. ggplot, plotly) sind in Sachen Visualisierung kaum Grenzen gesetzt. Allerdings sind dafür viel Fachwissen und Programmierkenntnisse nötig. Es eignet sich sowohl als interaktives Dashboard als auch für Exporte einzelner Ergebnisse.

Wenn ihr mehr über Datenvisualisierung erfahren wollt, gibt es einige Möglichkeiten sein Wissen zu erweitern. Unteranderem, wie im Text bereits erwähnt, ist der Blog von Cole Nussbaumer „Storytelling with Data“ sowie der Blog von Nathan Yau „Flowingdata“ sehr hilfreich. Eine weitere Empfehlung ist das Buch „Grammar of Graphics“, denn darauf basiert das R Paket ggplot.

Ein Beispiel wie eine Datenvisualisierung nicht umgesetzt werden sollte.

Zwei Visualisierungsbeispiele zur Fragestellung „Channel Performance“:

Datenvisualisierung

Abbildung 1

Zunächst ist die Datenbasis in einem gestapelten Datendiagramm visualisiert (Abbildung 1). Diese Darstellung wurde so von dem entsprechenden Tool vorgeschlagen und es wurden keine zusätzlichen Änderungen vorgenommen. Alle Daten werden korrekt dargestellt, es lässt sich allerdings nur schwer erkennen, wie die einzelnen Channel über die Zeit performen. Aussagekräftige Erkenntnisse können nicht direkt generiert werden.

 

Datenvisualisierung,

Abbildung 2

Die gleiche Datenbasis dargestellt durch vier einzelne Zeitreihen (Abbildung 2). Farblich hervorgehoben sind die beiden verhaltensauffälligen Channel 1 und 2. Weitere Informationen wurden aufgrund der Übersichtlichkeit in den Hintergrund gerückt. Auf den ersten Blick ist sichtbar, welche Erkenntnis das Diagramm übermitteln soll.

Wenn Du noch Fragen bezüglich der Datenvisualisierung hast oder du und dein Unternehmen Unterstützung benötigt, kannst du dich gerne bei uns melden.