Laut dem Global Data Management Benchmark Report von Experian aus dem Jahr 2018 betrachten 95 % der Führungskräfte auf Vorstandsebene Daten als integralen Bestandteil ihrer Unternehmensstrategie. Es besteht kein Zweifel daran, dass Daten einen bedeutenden Wert für jedes Unternehmen darstellen. Aber sind alle Daten gleichermaßen wertvoll? Kurz zusammengefasst: nein.
Auch wenn man meinen könnte, dass die Datenerfassung an sich schon die halbe Miete ist – die eigentliche Herausforderung besteht darin, während des gesamten Lebenszyklus einen hohen Datenqualitätsstandard aufrechtzuerhalten.
In diesem Beitrag befassen wir uns mit der Definition und der Bedeutung von Datenqualität. Außerdem erfahren Sie, welche Tools Ihnen beim Management und bei der Analyse der Datenqualität helfen können.
Was ist Datenqualität?
Die Datenqualität misst, wie gut die Daten ihren beabsichtigten Zweck erfüllen, sowie ihre Genauigkeit und Relevanz. Als hochwertige Daten bezeichnen wir Daten, die zu fundierten, informierten und datengestützten Entscheidungen führen.
Wie können hochwertige Daten dazu beitragen, als Unternehmen bessere Entscheidungen zu treffen?
Betrachten wir ein Beispiel dafür, wie hochwertige Daten es Unternehmen ermöglichen können, die optimalen Entscheidungen zu treffen:
- Sie verfügen über Daten, diese sind jedoch noch nicht nutzbar: Zu diesem Zeitpunkt liegen Ihnen lediglich Werte in einer Datenbank oder einer Excel-Tabelle vor. Diese Rohdaten haben keinen praktischen Nutzen. Sie haben beispielsweise eine CSV-Datei mit Tausenden von E-Mail-Adressen Ihrer Kundinnen und Kunden und deren Interessen.
- Sie verwandeln Daten in Informationen: Sie nehmen diese Daten in ein Tool auf, mit dem Sie sie im richtigen Kontext übersichtlich veranschaulichen können, zum Beispiel eine E-Mail-Liste innerhalb Ihrer Marketing-App. Jetzt können Sie diese E-Mail-Adressen nach den jeweiligen Interessen Ihrer Kundschaft filtern.
- Sie erlangen Erkenntnisse: Sie analysieren die Informationen, die Sie gesammelt haben, und gewinnen daraus wichtige Erkenntnisse. So erfahren Sie vielleicht, dass 80 % Ihrer Kunden und Kundinnen per E-Mail über CRM-Lösungen informiert werden möchten.
- Sie treffen eine fundierte Entscheidung: Mit diesem Wissen können Sie datengestützte Entscheidungen treffen, wie zum Beispiel einen Newsletter mit Informationen zu CRM-Systemen zu erstellen. Mit hochwertigen Daten haben Sie das nötige Hintergrundwissen, um die richtigen Entscheidungen für Ihr Unternehmen zu treffen.
Merkmale und Kriterien der Datenqualität
Da es Daten in allen Formen und Größen gibt, ist es nicht immer ganz einfach, ihre Qualität zu bestimmen. Dennoch gibt es einige Merkmale und Kriterien, die in der Regel darauf hinweisen, dass es sich um hochwertige Daten handelt. Wenn Sie Ihre eigenen Daten auf diese Merkmale hin untersuchen, erhalten Sie eine bessere Vorstellung von der Qualität Ihrer Daten:
1. Genauigkeit
Sind Ihre Daten korrekt? Spiegeln sie die vorliegende Situation wirklich richtig wider? Um Richtigkeit und Präzision zu gewährleisten, müssen Sie Ihre Strategie zur Datenverwaltung laufend optimieren. Die Datengenauigkeit ist eng mit der Datenintegrität verbunden.
Ist ein Geburtsdatum im deutschen oder angloamerikanischen Format vorhanden? Sind bei Zahlen aufgerundete Werte gegeben oder genauere mit Zahlen hinter dem Komma? Hier gilt, das vorgegebene Format präzise einzuhalten.
2. Vollständigkeit
Sind Ihre Daten vollständig? Unvollständige Informationen sind möglicherweise unbrauchbar.
Natürlich ist es nicht ratsam, mehr als das unbedingt Notwendige zu erfassen. Allerdings sollten Sie sicherstellen, dass die wichtigsten Informationen unbedingt aufgenommen werden, wenn Sie neue Einträge in Ihrer Datenbank speichern. Sonst stehen Sie am Ende mit Namen ohne Nachnamen oder unvollständigen Telefonnummern da, die Sie nicht verwenden können.
3. Relevanz
Sind das wirklich die Daten, die Sie benötigen? Seien wir mal ehrlich: Nicht alle Daten, die Sie erheben, sind immer von großem Nutzen. Wenn Sie Daten allerdings aus einem bestimmten Grund erheben, und die dabei gewonnenen Informationen diesem Zweck dienen können, dann liegen Ihnen hochwertige Daten vor.
Wenn Sie Ihre Kundinnen und Kunden zum Beispiel nach ihrem Geburtsjahr fragen, wenn sie sich für eine Testversion Ihres Produkts anmelden, ihr Alter für Sie aber keine brauchbare Information darstellt, sind das Daten ohne Zweck. In so einem Fall sind Daten also nur deshalb, weil sie richtig sind, nicht auch gleich effektiv.
4. Konsistenz
Stehen Ihre Daten im Widerspruch zu anderen Quellen? Hochwertige Daten sollten nicht im Widerspruch zu den in anderen Datenbanken gespeicherten Daten stehen. Andernfalls müssten Sie davon ausgehen, dass einer der beiden Datensätze fehlerhaft ist – aber welcher?
Wenn Unstimmigkeiten zwischen Datenbanken vorliegen, kann sich die Suche nach dem Fehler als ziemlich mühsam erweisen. Stellen Sie stattdessen sicher, dass es nur eine zentrale Datenquelle gibt – ob das nun bedeutet, dass alle Beteiligten dieselbe Datensoftware verwenden oder Ihr Datentool mit Ihrem CRM-System integriert wird.
Auf diese Weise können alle Personen in Ihrem Unternehmen über ein einziges Tool auf Ihre Daten zugreifen, unabhängig davon, wo sie sich befinden und wann sie den Zugriff benötigen.
5. Zugänglichkeit
Sind die Daten für die richtigen Personen zugänglich? Ähnlich wie beim vorangegangenen Punkt interagieren viele Unternehmen über unterschiedliche Anwendungen mit ihrer bestehenden Kundschaft sowie ihren Interessierten, Partnern und Mitarbeitenden.
Infolgedessen sind die Daten über verschiedene Tools verstreut, und ohne eine Softwareintegration haben Sie schnell ein Problem mit Datensilos.
Datensilos sind eine der Hauptursachen für schlechte Datenqualität. Selbst wenn die Daten genau, konsistent und relevant sind, erfüllen sie ihren Zweck nicht, wenn das betreffende Team keinen Zugang zu ihnen hat. Um die Zugänglichkeit zu gewährleisten, müssen Sie Ihre Geschäftssysteme integrieren.
6. Aktualität
Sind Ihre Daten auf dem aktuellen Stand? Daten ändern sich ständig. Das Problem mit veralteten Daten ist, dass sie die aktuelle Situation möglicherweise nicht mehr repräsentativ wiedergeben. Historische Daten im Blick zu behalten ist eine gute Sache – wichtig dabei ist jedoch, ein klares Zeitgefühl zu haben.
Sie können Ihre Daten ruhig aufbewahren, aber Sie brauchen weiterhin Echtzeitdaten und -berichte, um stets über etwaige Veränderungen auf dem Laufenden zu bleiben. Auf diese Weise können Sie von diesen Veränderungen profitieren oder eventuelle Probleme frühzeitig entschärfen.
7. Redundanzfreiheit
Sind Daten in verschiedenen Schreibweisen vorhanden? Die Redundanzfreiheit bedeutet, dass Dubletten vermieden werden sollen. Ist eine Person zweimal in verschiedenen Schreibweisen, zum Beispiel als Frau Meier und Maier, vorhanden, wird sie als zwei Personen gezählt. Entfernen Sie alle Duplikate bzw. Doppelungen und bereinigen Sie Ihre Daten.
Datenqualitätsmanagement: Datenqualität erfolgreich steuern
Datenqualitätsmanagement ist der Prozess, der sicherstellt, dass Ihr Team Zugang zu qualitativ hochwertigen Daten hat – es geht darum, Erkenntnisse über den Zustand Ihrer Daten zu gewinnen, um diesen Zustand bei Bedarf zu optimieren. Auf diese Weise können Sie genaue Daten verwenden und umfangreichere Datensätze erstellen.
Von der Datenanalyse bis hin zur Datenüberwachung
Um eine hohe Data Quality zu gewährleisten, sollten Sie in Ihrem Unternehmen drei wichtige Prozesse bei den Datenbeständen regelmäßig durchführen: die Datenanylse, die Datenreinigung und die Datenüberwachung.
Die Datenanalyse erkennt Fehler, Dopplungen und Widersprüche in den Datenbanken. Das können unbeständige Datensätze sein oder fehlerhafte beziehungsweise unvollständige Daten. Sie prüfen, ob Ihre Daten genau, relevant, aktuell und für die beabsichtigte Verwendung sowie Anwendung geeignet sind. Mit diesen Erkenntnissen können Sie eine Matrix oder Norm festlegen, um Abweichungen schnell zu erkennen und die Qualität zu verbessern.
Bei der Datenbereinigung werden Missstände durch die Fehleranalyse beseitigt. Für dieses „Reinigungsverfahren“ kommen unterschiedliche Algorithmen zum Einsatz. Durch eine zunehmende Automatisierung dieser Prozesse ist der manuelle Aufwand gering. Hierbei können Sie unter anderem Dubletten beseitigen oder leere Pflichtfelder vervollständigen.
Die Datenüberwachung beziehungsweise das Datenmonitoring prüft regelmäßig die Qualität, Vollständigkeit und Aktualität der Datensätze. Gibt es größere Abweichungen oder häufige Fehler, können Alarm-Benachrichtigungen oder Trendberichte Sie über negative Entwicklungen informieren.
Kennzahlen zur Datenqualität
Anhand von Kennzahlen zur Datenqualität können Sie die Qualität Ihrer Daten bestimmen – es handelt sich dabei um die einzigartigen Indikatoren, die Sie zur Analyse Ihrer Daten einsetzen.
Die Kennzahlen zur Qualität der Daten bestimmen den Grad der Genauigkeit, Relevanz, Anwendung usw. Ihrer Daten – so wissen Sie, wie hoch (oder niedrig) die Qualität Ihrer Daten ist.
Best Practices für das Datenqualitätsmanagement
Für das Datenqualitätsmanagement finden Sie hier einige Best Practices, die Sie bei der Analyse der Qualität Ihrer Daten beachten sollten:
- Bestimmen Sie die wichtigsten Kennzahlen für Ihr Team.
- Gewinnen Sie die Zustimmung in Ihrem gesamten Unternehmen, damit alle die Bedeutung der Datenqualität verstehen.
- Prüfen Sie die Datenqualität regelmäßig.
- Investieren Sie in die erforderlichen Ressourcen für Datenberichte, Analysen und Qualitätsschulungen.
- Ermitteln Sie die Gründe für etwaige Mängel in der Datenqualität oder herausragende Erfolge, die Ihr Team verzeichnet.
- Verwenden Sie ein Tool für das Datenqualitätsmanagement (im nächsten Abschnitt erfahren Sie mehr zum Thema Tools für eine höhere Datenqualität – diese sind beim Datenqualitätsmanagement eine große Hilfe).
- Stellen Sie sicher, dass es in Ihrem Unternehmen eine zentrale Datenquelle gibt (ob in Ihrem CRM-System, Ihrer Verkaufssoftware usw.).
Tools für die Qualität von Daten
Im folgenden Abschnitt finden Sie acht nützliche Tools, die Ihnen in Bezug auf das Thema Datenqualität unter anderem dabei helfen können, die oben genannten Anforderungen zu erfüllen.
1. Operations Hub
Quelle: Screenshot Operations Hub
Mit Operations Hub können Sie mühelos Kundendaten synchronisieren und Geschäftsprozesse automatisieren. Dank der gemeinsam genutzten, synchronisierten Kundendatenbank bleiben Ihre Teams stets gut aufeinander abgestimmt. Gleichzeitig können Sie auf strategischer Ebene dafür sorgen, dass Ihr Unternehmen auch in Zukunft flexibel auf die Bedürfnisse Ihrer Kundschaft ausgerichtet ist.
Operations Hub automatisiert den Prozess der Datenqualitätsanalyse: Anstelle einer programmierbaren Automatisierung (oder auch „Choose-your-own-Adventure“ genannt) sind die Maßnahmen zur Sicherstellung der Datenqualität in HubSpot bereits vordefiniert und sofort einsatzbereit.
Operations Hub von HubSpot umfasst drei innovative Features zur programmierbaren Automatisierung: 1) benutzerdefinierte kodierte Workflow-Aktionen, 2) benutzerdefinierte kodierte Bot-Aktionen und 3) Webhooks in Workflows.
Apropos Workflows: Diese sind ideal dafür, um Lösungen für gängige Datenprobleme zu entwickeln und zu automatisieren. So können Sie beispielsweise einen Workflow einrichten, der die Angabe „Vorname“ groß schreibt, wenn ein neuer Kontakt ein Demoformular ausfüllt.
Profitipp: Nutzen Sie Operations Hub von HubSpot, um Kundendaten ganz einfach zu synchronisieren und Geschäftsprozesse zu automatisieren, damit Ihr Team alle Kundendaten mithilfe einer zentralen Plattform im Blick behält.
2. Insycle
Quelle: Screenshot Insycle
Insycle – ein Partner von HubSpot und Anbieter einer Integration für die HubSpot App – stellt eine umfassende Lösung für das Management von Kundendaten bereit. Es hilft Ihnen dabei, Ihre Kundendaten zu verwalten, zu automatisieren und zu pflegen. Insycle optimiert die Effizienz, die Genauigkeit der Berichte und die Abstimmung im Team.
3. Dedupely
Quelle: Screenshot Dedupely
Dedupely spürt doppelte Datensätze automatisch auf und führt sie zusammen, was Ihnen nicht nur Zeit und Nerven spart, sondern auch das Vertrauen und die Abstimmung im gesamten Unternehmen verbessert.
4. SAS
Quelle: Screenshot SAS
SAS ist eine Unternehmenssoftware mit Funktionen, mit denen Sie Ihre Daten verwalten, optimieren, integrieren und steuern können. Eines der am besten bewerteten Produkte ist SAS Data Management, welches speziell für die Integration und Bereinigung von Daten entwickelt wurde. Das Tool bietet zudem umfangreiche Möglichkeiten zur Implementierung von Data Governance.
Weiterhin bietet das Unternehmen mit SAS Data Quality eine Lösung zur Behebung von Datenqualitätsproblemen, bei der Ihre Daten nicht verschoben werden müssen.
5. Talend Open Studio
Quelle: Screenshot Talend Open Studio
Talend Open Studio ist Teil einer Open-Source-Suite, die auf die Bedürfnisse mittelständischer Unternehmen zugeschnitten ist. Durch den Drag-and-Drop-Builder ist es besonders flexibel einsetzbar und benutzerfreundlich. Talend bietet mehrere Features, die Ihnen bei der Lösung von Integrationsproblemen helfen.
6. OpenRefine
Quelle: Screenshot OpenRefine
OpenRefine (ehemals Google Refine) ist ein kostenloses Open-Source-Tool für Unternehmen jeder Größe, das speziell für die Verwaltung und Bereinigung von Daten entwickelt wurde.
Bei OpenRefine liegt der Schwerpunkt auf der Umwandlung und Neuformatierung unterschiedlicher Daten, um sie zu standardisieren. Diese Software ermöglicht es Ihnen, unzählige Erweiterungen und Plug-ins einzubinden, damit Sie mit verschiedenen Datenquellen und Formaten arbeiten können.
7. Datawarehouse.io (Ultimate Data Export)
Quelle: Screenshot Datawarehouse.io
Datawarehouse.io, auch bekannt als Ultimate Data Export, ist eine Data-Warehousing-Middleware für Ihre Daten in HubSpot. Durch die Synchronisierung der Software werden Ihre Plattform und Daten in HubSpot ganz ohne Code integriert.
Exportieren Sie alle Ihre Daten aus HubSpot (z. B. Tickets, Produkte, E-Mails und Webanalysen) nahtlos in Excel und integrieren Sie sie in Business-Intelligence-Tools wie Tableau.
8. Ataccama
Quelle: Screenshot Ataccama
Ataccama ist eine Datenmanagement- und Governance-Plattform mit Tools für die Analyse der Datenqualität, die Datenverwaltung, die Datenkatalogisierung, das Referenzdatenmanagement, die Datenintegration und die Datenprofilierung.
Die Funktionen des Tools zur Datenanalyse und -verwaltung geben Ihnen einen Überblick über die Qualität Ihrer Daten. Sie helfen Ihnen auch, Ihre Daten zu prüfen, sie zu optimieren, minderwertige oder falsche Daten herauszufiltern und die Qualität im Laufe der Zeit zu überwachen.
Verschaffen Sie sich einen umfassenden Überblick über die Qualität Ihrer Daten
Eine hohe Datenqualität zu gewährleisten ist nicht immer einfach. Der Zeit- und Arbeitsaufwand zahlt sich jedoch durch den langfristigen Erfolg Ihres Unternehmens aus. Es ermöglicht Führungskräften, fundierte und datengestützte Entscheidungen zu treffen.
Wer sich nicht umfassend mit Daten auskennt, kann dennoch von einigen Schlüsselkonzepten, Techniken und Tools profitieren, die es Teams ermöglichen, ihre Datenqualität zu verbessern.
Titelbild: Weiquan Lin / iStock / Getty Images Plus