Was ist Data Analytics?

Data Analytics sollte man keineswegs mit Data Science gleichsetzen: Vielmehr ist Data Analytics als einen der grundlegenden Teilbereiche von Data Science zu verstehen. Der Data Analytics Prozess lässt sich in die Schritte der Datenaufbereitung, die Datenanalyse, die Datenvisualisierung sowie die Interpretation und Ableitung von Maßnahmen unterteilen. Die Datenwissenschaften hingegen gehen über die Datenanalyse hinaus. Mit der Entwicklung von Algorithmen und der Anwendung von Machine Learning Modellen ist das Feld des Data Science sehr viel weitreichender.

Technologischer Fortschritt erfordert einen adaptiven Umgang mit Big Data

Big Data sind riesige Datenmengen, die mit den herkömmlichen Methoden der Datenanalyse kaum zu bewältigen sind. Aufgrund des zunehmenden Datenvolumens, der ansteigenden Geschwindigkeit der Datenerzeugung sowie der Varianz an Datenquellen sowie -formaten bedarf es stetig fortschrittlicheren und umfassenderen Data Analytics Methoden. So ist es mittlerweile möglich, Daten in Echtzeit zu analysieren, sodass man zeiteffizient wertvolle Erkenntnisse generieren kann. Dennoch stehen Analysten vor immer neuen Herausforderungen.

Python ist die Nummer eins für Analysen, für die Visualisierung empfiehlt sich eher PowerBI

Es gibt viele konkurrierende Anbieter für die Datenauswertung und -visualisierung. Besonders gängig und vor allem bei Professionals beliebt, die aus dem Informatik-Segment kommen: Python. Durch die Einbindung verschiedener Bibliotheken wie Pandas oder NumPy kann man schnell Auswertungen vornehmen. Python zeichnet sich dabei insbesondere durch die Geschwindigkeit aus. Auch die Sprache R ist noch immer zu finden, allerdings eher im geisteswissenschaftlichen Kontext der statistischen Datenanalyse. In anderen Bereichen ist die Anwendung R trotz der einfachen Handhabung eher unüblich. SQL in all seinen Varianten (z.B. MySQL oder OracleSQL) sind wichtig für die Analyse von Daten aus relationalen Datenbanken. Allerdings ist SQL alleine häufig nicht ausreichend, da möglicherweise nicht alle Daten in relationalen Datenbanken ausreichen. In cloud-computing Tools wie Databricks findet man die Vorteile verschiedener Programmiersprachen wie Python und SQL, wobei das gesamte Datenmanagement übers Internet abläuft.

Die Visualisierungstools Tableau oder Microsoft PowerBI sollte man Python bevorzugen, wenn es um die Erstellung interaktiver Dashboards geht. Wenn es keiner komplizierten Programmierung bedarf, kann man als Entscheidungsgrundlage (regelmäßige) Reportings durchführen, die man in Dashboards visualisiert. Ein bedeutsamer Vorteil in dem Rahmen ist die Usability dieser Tools: Eine Drag-and-Drop Oberfläche ermöglicht eine einfache Interaktion. Apache Spark ist insbesondere für die Verarbeitung sehr großer Datenmengen geeignet. Sind die Data Sets hingegen sehr viel kleiner, ist auch nichts gegen eine grundlegende Analyse in Excel einzuwenden. Da Excel noch immer sehr bekannt und verbreitet ist, vor allem bei Nicht-Informatikern, darf auch dieses Tool nicht fehlen.

Abhängig von den Daten und dem Ziel wird ein Analysemodell gewählt

Es gibt unterschiedliche Arten der Datenanalyse: Mittels Deskriptive Analytics kann man aktuelle oder historische Daten beschreibend analysieren. Diagnostic Analytics hingegen gehen auf die Kausalität ein und suchen nach dem Ursache-Wirkungs-Prinzip Ursachen für das Zustandekommen der deskriptiven Daten und Trends. Im Bereich der Predictive Analytics verwendet man Prädiktive Modelle und Machine Learning, um zukünftige Daten basierend auf aktuellen oder historischen vorherzusagen. Der Unterschied zu Prescriptive Analytics liegt darin, dass man hier konkrete Handlungsempfehlungen fürs Decision Making ableitet, sodass man zuvor definierte Ziele erreichen kann. Exploratory Data Analysis ist von den anderen Analysemethoden abzugrenzen, da diese nicht hypothesengeleitet erfolgt. Vielmehr exploriert man Daten unvoreingenommen und identifiziert zufällig Muster, deren Plausibilität man mithilfe anderer Analysemethoden prüft.

Get into Data Analytics

Die Möglichkeiten für den Wissenserwerb im Bereich Data Analytics sind vielfältig: Abhängig davon, wie vertieft Kenntnisse erlernt werden sollen, ist für jeden was dabei, der mehr über die Welt der Datenanalyse erfahren möchte. Als Einstieg in das Thema sind kostenlose Online Trainings (z.B. YouTube Videos) empfehlenswert. Wer als Anfänger einen vertieften Überblick erzielen möchte, kann das von Google angebotene Google Data Analytics Professional Certificate oder ein Zertifikatskurs von anderen Unternehmen wie IBM belegen. Hier wird der gesamte Data Analytics Prozess behandelt, in Datenanalysetools wie Excel eingeführt und ein Überblick über statistische Kennzahlen gegeben.

Möchte man mehr über die Datenanalyse erfahren und fortgeschrittene professionelle Anwendungskenntnisse entwickeln, empfiehlt sich unter Umständen ein Data Analytics Course. Viele dieser Kurse werden als Bootcamps angeboten und erstrecken sich über einen Zeitraum von mehreren Wochen bis hin zu mehreren Monaten. Die zum Teil auf dem Campus oder remote angebotenen Bootcamps (z.B. von Ironhack oder NeueFische) werden in Unternehmen häufig (inoffiziell) als Weiterbildung oder Umschulung anerkannt, unterscheiden sich aber auch preislich zu den Zertifikatskursen. Nicht zuletzt gibt es die Möglichkeit, (Applied) Data Analytics zu studieren oder in anderen Studiengängen wie Data Science Data Analytics als Teilbereich oder als Nebenfach zu belegen. Auch gibt es die Möglichkeit, von Bereichen wie der Betriebswirtschaftslehre auf Data Analytics umzudisponieren.

Data Analytics wird überall benötigt

Daten gibt es überall. Und auch, wenn das momentan noch nicht der Ist-Zustand sein mag, hat Datenanalyse überall das Potenzial, Dinge zu verbessern. So vielfältig wie die Daten sind sind auch die beruflichen Aussichten im Bereich Data Analytics: In der Klassischen IT von Unternehmen (egal ob in der Medizin oder in landwirtschaftlichen Unternehmen), im Consulting oder als Freelancer. Die Jobs haben häufig die Möglichkeit, remote zu arbeiten, gemeinsam. Auch das Gehalt ist ein attraktives Argument für dieses Berufsfeld und die Möglichkeit, das Anwendungsgebiet nach Belieben zu wechseln.

2 Kommentare zu „Data Analytics vs. Data Science“

  1. Pingback: Aktien Tesla & Bayer: Data Science revolutioniert die Aktienanalyse - datascienceweekly.de

  2. Pingback: Clustering in der Datenanalyse - datascienceweekly.de

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Nach oben scrollen