175 Zettabytes – eine Zahl mit 21 Nullen. So hoch soll laut einer Prognose das weltweite Datenaufkommen im Jahr 2025 ausfallen. Diese Zahl ist unvorstellbar und schwer nachzuvollziehen. Sie zeigt jedoch eindrücklich, welche Bedeutung Big Data hat und zukünftig haben wird: Die massenhafte Erhebung, Verarbeitung und Analyse von Daten stellen einen wichtigen Bestandteil der Digitalisierung dar. Sie macht neue Erfindungen und Geschäftsmodelle möglich.

Webinar-Aufzeichnung: Work Smarter, Not Harder

In diesem Beitrag erklären wir Ihnen die Relevanz von Big Data, bekannte Beispiele und deren Technologien sowie den Zusammenhang mit Data Mining.

Big Data beinhaltet die Sammlung, Nutzung, Auswertung, Verwertung und Vermarktung digitaler Daten. Da das Thema verschiedene Dimensionen hat, hat es der Gartner-Analyst Doug Laney im Jahr 2001 in das 3V-Modell eingeteilt:

  • Data Volume: Größe der Datenmengen
  • Data Velocity: Geschwindigkeit der Datenerzeugung und -verarbeitung
  • Data Variety: Vielfalt der Datenarten, z. B. Fotos, Videos, Sensordaten etc.

Das neuere 6V-Modell ersetzte über die Jahre das 3V-Modell von Doug Laney. Dieses besteht aus den zusätzlichen Dimensionen:

  • Data Validity: Sicherstellung der Datenqualität
  • Data Veracity: Glaubwürdigkeit der Daten
  • Data (Business) Value: Wert der Daten (bspw. für unternehmerische Einsatzzwecke)

Zudem gibt es die 9V- und 10V-Modelle, bei denen noch diese Dimensionen enthalten sind:

  • Data Viability: Relevanz und Nützlichkeit der erhobenen Daten
  • Data Visibility: Sichtbarkeit, gerade in Bezug auf den Geschäftswert
  • Data Volatility: Vergänglichkeit, also die Löschung der Daten
  • Data Vulnerability: Verwundbarkeit, womit die Sicherheit der Daten gemeint ist

Beispiele für praktische Anwendungen von Big Data

Noch nie war es so einfach wie heute, Daten zu sammeln. Dabei werden oft verschiedenste Quellen herangezogen:

  • Websites & Onlineshops
  • Software & Apps
  • Sprachassistenten
  • Soziale Netzwerke
  • Suchmaschinen
  • Automobil & Verkehr
  • Wearables, z. B. Fitness-Tracker & Smartwatches
  • Roboter und IoT-Geräte

Die Liste lässt sich seitenlang weiterführen, täglich kommen neue Quellen und Technologien hinzu, die in Massendaten münden. 

Ein gutes Beispiel dafür wären etwa Smart-Home-Technologien, also Sensordaten von smarten Thermostaten, Bilder von Überwachungskameras, Anfragen an Sprachassistenten, Steuerdaten für die Heizung und vieles mehr. Allein in einem Smart Home fallen zahlreiche unstrukturierte Daten an, die Systeme erheben, verarbeiten und zwischen den Geräten austauschen. 

Was ist Data Mining?

Data Mining bedeutet übersetzt „Datenabbau“. Der englische Begriff wie auch die deutsche Übersetzung sind irreführend, denn beim Data Mining geht es nicht um den Abbau – also das Erheben und Sammeln – von Daten, sondern um deren Auswertung. Damit ist das Data Mining ein wichtiger Bestandteil des Themas Big Data.

Unternehmen sammeln und aggregieren heutzutage – und erst recht in Zukunft gigantische Datenvolumen. Damit Unternehmen aus Datenmassen wie im 3V-, 6V- oder 10V-Modell beschrieben einen Nutzen ziehen können, müssen die Daten analysiert und aufgearbeitet werden, sodass sie einen Wert besitzen. Dazu gehört bspw. der Vorgang des „Knowledge Discovery in Databases (KDD)“, der unter anderem Datensätze auswählt, bereinigt, reduziert und analysiert.

Dabei ist der Schritt der Analyse das Data Mining. Oft wird aber der ganze KDD-Prozess als Data Mining bezeichnet. Die Begriffe gehen daher im Sprachgebrauch fließend ineinander über.

Big-Data-Technologien

Für die Verarbeitung von Big Data sind viele klassische Technologien, zu denen in etwa die relationalen Datenbanksysteme gehören, nicht geeignet.

Stattdessen müssen Unternehmen, die mit Big Data arbeiten möchten, auf Server-Cluster und leistungsstarke Cloud-Lösungen setzen. Nur ein solcher Verbund aus hunderten oder gar tausenden Server-Einheiten schafft es, die hohen Anforderungen zu erfüllen. Dazu zählt bspw. die schnelle Verarbeitung gigantischer Datenmengen, am besten in Echtzeit.

Bekannte Vertreter solcher Big-Data-Technologien sind unter anderem:

Ohne Massendaten gibt es keine Digitalisierung

Die Erhebung und Verarbeitung von Massendaten ist per se nichts Schlechtes. Ohne Daten geht es nun mal nicht – gerade bei komplexen digitalen Lösungen. Sie dienen z. B. dazu, dass autonom fahrende Autos alle benötigten Informationen erhalten, um auch wirklich eigenständig fahren zu können.

Im Bereich von E-Commerce und Vertrieb kommen die Daten zum Einsatz, um Kunden entlang ihrer Customer Journey ganz individuelle und passende Angebote unterbreiten zu können.

Und der Kundenservice kann mit genauen Nutzerdaten auf deren spezifische Anfragen eingehen und optimale Lösungen erarbeiten.

Neue Strukturen durch Big Data

Big Data bietet viele Chancen für die Weiterentwicklung bestehender digitaler Produkte und Dienstleistungen. Dies ermöglicht ganz neue Geschäftsmodelle – in etwa im Bereich Deep Tech. Damit dies gelingt, ist nicht das Sammeln der Daten die größte Herausforderung, sondern deren Auswertung, Strukturierung und Analyse. Nur so bekommen die Informationen einen Wert für Unternehmen – und für die Nutzer.

Productivity Guide

Headerbild: Tetiana Lazunova / iStock / Getty Images Plus

Ursprünglich veröffentlicht am 28. Februar 2020, aktualisiert am Februar 28 2020

Themen:

Digitalisierung