Was versteht man unter Big Data? Definition und Beispiele

Die Zukunft des Vertriebs
Marc Ollmann
Marc Ollmann

Aktualisiert:

Veröffentlicht:

Big Data ist wichtig: Die massenhafte Erhebung, Verarbeitung und Analyse von Daten stellt einen wichtigen Bestandteil der Digitalisierung dar. Sie macht neue Erfindungen und Geschäftsmodelle möglich. In diesem Beitrag erklären wir Ihnen die Relevanz von Big Data, liefern bekannte Beispiele und zeigen den Zusammenhang mit Data Mining auf.

Mann am Laptop beschäftigt sich mit Big Data

→ Big Data, KI und Automation im Vertrieb [Kostenloser Download]

Was beinhalten die Big Data V-Modelle?

Da das Thema Big Data verschiedene Dimensionen hat, hat es der Gartner-Analyst Doug Laney im Jahr 2001 in das 3V-Modell eingeteilt:

  • Data Volume: Größe der Datenmengen
  • Data Velocity: Geschwindigkeit der Datenerzeugung und -verarbeitung
  • Data Variety: Vielfalt der Datenarten, z. B. Fotos, Videos, Sensordaten etc.

Im Laufe der Big Data Geschichte wurde das 3V-Modell von Doug Laney durch das neuere 6V-Modell ersetzt. Dieses besteht aus den zusätzlichen Dimensionen:

  • Data Validity: Sicherstellung der Datenqualität
  • Data Veracity: Glaubwürdigkeit der Daten
  • Data (Business) Value: Wert der Daten (bspw. für unternehmerische Einsatzzwecke)

Zudem gibt es die 9V- und 10V-Modelle, bei denen darüber hinaus folgende Dimensionen enthalten sind:

  • Data Viability: Relevanz und Nützlichkeit der erhobenen Daten
  • Data Visibility: Sichtbarkeit, gerade in Bezug auf den Geschäftswert
  • Data Volatility: Vergänglichkeit, also die Löschung der Daten
  • Data Vulnerability: Verwundbarkeit, womit die Sicherheit der Daten gemeint ist

Was ist das Ziel von Big Data?

Das große Gebiet zielt darauf ab, wertvolle Erkenntnisse aus riesigen, komplexen Datensätzen zu gewinnen und dadurch eine fundierte Entscheidungsfindung zu ermöglichen. Es kann auch dazu beitragen, die Interaktion mit Kunden und Kundinnen zu verbessern, indem es tiefgreifende Kenntnisse über deren Präferenzen und Verhaltensweisen bietet.

Zudem kann Big Data die betriebliche Effizienz steigern und zur Risikominimierung beitragen, indem es Muster und Trends identifiziert. Schließlich fördert Big Data die Entwicklung von innovativen Produkten durch die Analyse von Kunden- und Kundinnendaten, Markttrends und Wettbewerbsinformationen.

Wie funktioniert Big Data?

Durch die zunehmende Digitalisierung entstehen jeden Tag gewaltige, komplexe Mengen an Daten. Diese sind mit „traditionellen“ Systemen zur Datenverarbeitung nicht mehr auswertbar und nutzbar. Deshalb werden spezielle Big Data Architekturen entworfen und realisiert. Diese dienen zum Sammeln und Verwerten und zur Darstellung der Informationen. Da die Technologien in der Regel über große Online-Netzwerke basieren, spricht man von der Big Data Cloud.

Die Funktionsweise von Big Data kann grob in diese fünf Schritte unterteilt werden: Datenerfassung, Datenspeicherung, Datenverarbeitung, Datenanalyse und Datenvisualisierung.

Ein essentieller Bestand im Bereich Big Data ist das Data Mining, was übersetzt „Datenabbau“ bedeutet. Der englische Begriff wie auch die deutsche Übersetzung sind irreführend, denn beim Data Mining geht es nicht um den Abbau, also das Erheben und Sammeln, von Daten, sondern um deren Auswertung. Damit ist das Data Mining ein wichtiger Bestandteil des Themas Big Data.

Unternehmen sammeln und aggregieren heutzutage – und erst recht in Zukunft gigantische Datenvolumen. Damit Unternehmen aus Datenmassen wie im 3V-, 6V-, 9V- oder 10V-Modell beschrieben einen Nutzen ziehen können, müssen die Daten analysiert und aufgearbeitet werden, sodass sie einen Wert besitzen. Dazu gehört beispielsweise der Vorgang des „Knowledge Discovery in Databases (KDD)“, der unter anderem Datensätze auswählt, bereinigt, reduziert und analysiert.

Dabei ist der Schritt der Analyse das Data Mining. Oft wird aber der ganze KDD-Prozess als Data Mining bezeichnet. Die Begriffe gehen daher im Sprachgebrauch fließend ineinander über.

Was ist Big Data Visualization?

Bei der riesigen Menge an Daten, die über eine Big Data Cloud aggregiert und verarbeitet werden, ist es entscheidend, dass die Informationen auf eine Weise dargestellt werden, die beispielsweise Datenanalysten und -analystinnen (Data Scientists) leicht verstehen und analysieren können. Das Feld der Big Data Visualization befasst sich mit der Darstellung von Big Data in grafischer Form, um Muster, Trends und Zusammenhänge leicht erkennbar zu machen.

Die Visualisierung dient dazu, Entscheidungsprozesse zu vereinfachen. Ebenso hilft sie dabei, neue Ideen und Konzepte zu entwickeln. So ist ein Big Data Trend das sogenannte Big Data Marketing. Diese spezielle Form von datengetriebenem Marketing ermöglicht es, die komplizierte Reise der Kundschaft, die Customer Journey, genauer zu analysieren und mit individuellen, maßgeschneiderten Marketingkampagnen darauf zu reagieren.

Somit gehen Business Intelligence und Big Data Visualization sinnbildlich Hand in Hand. Unternehmen, die auf den Trend Big Data Marketing setzen, gehen zum Beispiel so vor: Sie erarbeiten zuerst eine Big Data Strategie und legen danach ihre Datenquellen fest. Dabei gilt folgende Leitfrage: Welche Quellen gibt es bereits und welche neuen sollen „angezapft“ werden?

Danach muss über eine Big Data Cloud dafür gesorgt werden, dass alle relevanten Daten erhoben, gespeichert und der Zugriff gewährleistet wird. Schlussendlich geht es in den Bereich der Big Data Analytics: Experten und Expertinnen werten unter anderem über Tools zur Big Data Visualization die Massendaten aus und leiten mögliche Erkenntnisse und Entscheidungen ab.

Weitere Beispiele für die praktische Anwendung von Big Data

Noch nie war es so einfach wie heute, Daten zu sammeln. Dabei werden oft verschiedenste Datenquellen herangezogen:

  • Websites und Onlineshops
  • Software und Apps
  • Sprachassistenten
  • Soziale Netzwerke
  • Suchmaschinen
  • Automobil und Verkehr
  • Wearables, z. B. Fitness-Tracker und Smartwatches
  • Roboter und IoT-Geräte

Die Liste lässt sich lange weiterführen, täglich kommen neue Quellen und Technologien hinzu, die in Massendaten münden.

Hier zwei bekannte Big Data Best Practices:

Autonom fahrende Autos

Damit die sogenannten Robo-Taxis sicher fahren können, haben sie zahlreiche Sensoren an Bord. Damit wird in Echtzeit alles überwacht, was den Straßenverkehr angeht – von der Erfassung von Schildern und Ampeln bis hin zu den Bewegungen von Fußgängern und Fußgängerinnen. Das Ergebnis sind gigantische Datenmengen.

Smart Home Technologien

In einem Smart Home fallen zahlreiche unstrukturierte Daten an, die Systeme erheben, verarbeiten und zwischen den Geräten austauschen. Dazu gehören Sensordaten von smarten Thermostaten, Bilder von Überwachungskameras, Anfragen an Sprachassistenten, Steuerdaten für die Heizung und vieles mehr. Wird Big Data mit KI-Technologien verbunden, können selbstüberwachende Systeme entstehen.

Big Data Technologien

Für die Verarbeitung von Big Data sind viele klassische Technologien, zu denen etwa die relationalen Datenbanksysteme gehören, nicht geeignet. Stattdessen müssen Unternehmen, die mit Big Data arbeiten möchten, auf Server-Cluster und leistungsstarke Big Data Cloud-Lösungen setzen.

Nur ein solcher Verbund aus hunderten oder gar tausenden Server-Einheiten schafft es, die hohen Anforderungen zu erfüllen. Dazu zählt unter anderem die schnelle Verarbeitung gigantischer Datenmengen, am besten in Echtzeit.

Bekannte Vertreter solcher Big Data Technologien sind:

Neben den Big Data Databases gibt es zahlreiche weitere Big Data Tools, die zunehmend zum Einsatz kommen – beispielsweise für Data Mining und Big Data Visualization. Hier haben sich Big Data Analytics Tools wie Tableau, Zoho Analytics und IBM Watson etabliert.

Warum ist Big Data so wichtig?

Die Erhebung und Verarbeitung von Massendaten ist per se nichts Schlechtes. Denn ohne Daten geht es nicht – gerade bei komplexen digitalen Lösungen. Sie dienen zum Beispiel dazu, dass autonom fahrende Autos alle benötigten Informationen erhalten, um auch wirklich eigenständig fahren zu können.

Im Bereich von E-Commerce und Vertrieb kommen die Daten zum Einsatz, um Kunden und Kundinnen entlang ihrer Customer Journey ganz individuelle und passende Angebote unterbreiten zu können. Mit genauen Nutzer- und Nutzerinnendaten kann der Kundenservice auf deren spezifische Anfragen eingehen und optimale Lösungen erarbeiten.

Big Data ist somit ein zunehmend wichtiger Bestandteil unserer digitalisierten, vernetzen Welt.

Was ist die Gefahr von Big Data?

Die Nutzung von Big Data birgt auch einige potenzielle Gefahren. Ein Hauptaspekt der Kritik an Big Data ist der Schutz der Privatsphäre und persönlicher Daten. Die umfangreiche Sammlung und Analyse von Daten kann zu Datenschutzverletzungen und Missbrauch führen. Zudem besteht das Risiko von Verzerrungen und Fehlinterpretationen der Daten, was zu fehlerhaften Entscheidungen führen kann.

Die Abhängigkeit von Big Data kann außerdem technische Ausfälle und Datenverluste begünstigen. Die Macht und Konzentration von Daten bei großen Unternehmen wirft Fragen des Wettbewerbs und der Monopolbildung auf. Angemessene Maßnahmen und ethische Standards sind erforderlich, um potenzielle Gefahren zu minimieren und das volle Potenzial von Big Data auszuschöpfen.

Fazit: Neue Strukturen durch Big Data

Big Data bietet viele Chancen für die Weiterentwicklung bestehender digitaler Produkte und Dienstleistungen. Das ermöglicht ganz neue Geschäftsmodelle – etwa im Bereich Deep Tech. Damit dies gelingt, ist nicht das Sammeln der Daten die größte Herausforderung, sondern deren Auswertung, Strukturierung und Analyse. Nur so bekommen die Informationen einen Wert – für Unternehmen und für die Nutzer und Nutzerinnen.

New call-to-action

Titelbild: courtneyk / iStock / Getty Images Plus

Themen: Datenmanagement

Verwandte Artikel

Erfahren Sie, wie die Trends Big Data, KI und Automatisierung in der Praxis aussehen.

KOSTENLOS HERUNTERLADEN