Dieser Artikel wurde maschinell übersetzt.
Untersuchen Sie gesammelte Informationen und erkennen Sie mithilfe der Datenprofilierung Fehler, Inkonsistenzen und Chancen.
Verlassen Sie sich nicht nur auf Ihre Augen. Arbeiten Sie mit Datenprofilierungsunternehmen zusammen, die Ihre Informationen in großem Umfang überprüfen und Ihnen Einblicke geben können, die Sie nutzen können.
Lassen Sie uns tiefer in die Bedeutung der Datenprofilerstellung eintauchen, damit Sie feststellen können, ob dies ein Ansatz ist, den Sie in Ihr Toolkit aufnehmen sollten.
Was ist Data Profiling?
Viele Unternehmen sammeln Informationen. Tatsächlich geben mehr als 90 Prozent der Unternehmen an, dass sie jedes Jahr mehr für Big Data Lösungen ausgeben. Aber nur 72 Prozent von ihnen haben eine datengetriebene Kultur geschaffen. Schuld sind Fehler und verpasste Chancen. Lösen Sie diese Probleme mit der Erstellung von Datenprofilen.
Bei der Erstellung von Datenprofilen werden Ihre Informationen mit digitalen Tools durchkämmt, um:
- Verifizieren. Stellen Sie sicher, dass die Daten in Ihren Tabellen mit den Beschreibungen übereinstimmen.
- Offenbaren. Ermitteln Sie die Beziehungen zwischen verschiedenen Quellen, Datensätzen und Tabellen.
- Richtig. Erkennen Sie Inkonsistenzen bei der Eingabe (z. B. manchmal ausgeschriebene Zahlen), die Sie daran hindern, klare Zusammenhänge herzustellen.
- Analysieren. Nutzen Sie bereinigte Daten und peppen Sie Ihre Berichte und Präsentationen auf.
Die Erstellung von Datenprofilen beginnt mit der Erkennung. Es gibt drei Typen.
- Inhalt: Erkennen Sie Werte, die null, falsch oder irgendwie ungewöhnlich sind. Tippen Sie auf jeden Datensatz einzeln.
- Beziehungen: Finden Sie heraus, wie Informationen miteinander verbunden sind und sich überschneiden. Nutzen Sie Ihre Erkenntnisse, um eine effiziente Wiederverwendung der Daten zu ermöglichen.
- Struktur: Stellen Sie sicher, dass Ihre Daten korrekt formatiert und konsistent eingegeben werden.
Die Erstellung von Datenprofilen ist ein bisschen wie ein Hausputz. Jede Datei ist eine potenzielle Fehlerquelle. Deine Arbeit hilft, Ordnung zu halten.
Wie funktioniert die Erstellung von Datenprofilen?
Fast ein Viertel aller Unternehmen kann Big Data nicht für Endbenutzer zugänglich machen. Wenn Sie Informationen aus Hunderten (oder sogar Tausenden) von Quellen sammeln und die IT nie überprüfen, reinigen oder massieren, könnten Sie Teil dieser Gruppe sein.
Verwenden Sie eine (oder mehrere) bewährte Techniken zur Erstellung von Datenprofilen, wie z. B.:
- Spaltenprofilierung. Scannen Sie Ihre Tabellen, um Muster und Inkonsistenzen zu erkennen. Vergleichen Sie mehrere Spalten auf Inkonsistenzen und Abhängigkeiten.
- Datenanalyse. Erkennen Sie Beziehungen zwischen Feldern und beseitigen oder verfeinern Sie Verbindungen, wenn sich die Eingaben überlappen oder nicht ausgerichtet sind.
- Validierung von Datenregeln. Erstellen Sie feste Gliederungen, die vorschreiben, wie Daten gesammelt und aufgezeichnet werden.
- Muster-Abgleich. Finden Sie gültige Formate für Ihre Tabellen und Datasets.
- Erstellung von Tabellenprofilen. Identifizieren Sie fehlende oder verwaiste Datensätze. Untersuchen Sie, wie sich Spalten überschneiden und Daten duplizieren.
Die Bereinigung von Daten ist von entscheidender Bedeutung. Syncari (ein Unternehmen, das ein Tool zur Erstellung von Datenprofilen anbietet) sagt, dass schlechte Daten Unternehmen 15 Prozent ihres Umsatzes kosten.
Aber wenn Sie von der Idee, Ihre Daten von Hand zu überprüfen, eingeschüchtert sind, sind Sie nicht allein. Die visuelle Untersuchung kritischer Daten ist sowohl zeitaufwändig als auch ineffizient. Versuchen Sie es stattdessen mit einem Softwareanbieter.
Enthält Ihr Data Warehouse personenbezogene Daten? Erfahren Sie mehr über die Regeln und Vorschriften rund um diese ganz besondere und spezifische Art von Informationen in unserem Blog.
Referenzen
Die Bemühungen der Unternehmen, datengesteuert zu werden, scheitern. (Februar 2019). Harvard Business Review.
Die häufigsten Probleme, mit denen Unternehmen bei ihren Big Data konfrontiert sind, analysieren. Business Intelligence.
Die katastrophalen Kosten schlechter Daten und wohin die Reise geht. (November 2019). Syncari.