Data Driven Marketing bedeutet unter anderem, Entscheidungen nicht mehr basierend auf einem Bauchgefühl zu treffen, sondern auf Daten abzustützen und damit zu fundieren. So weit, so gut. Nur: Wie fundiert kann eine Entscheidung sein, wenn die der Entscheidung zu Grunde liegenden Daten fehlerhaft sind? An diesem Punkt setzt der folgende Beitrag an, indem er sich mit der Bedeutung von und Wegen zur Gewährleistung einer Integrität von Daten auseinandersetzt.
Unter Datenintegrität wird laut Gablers Wirtschaftslexikon die „Korrektheit der gespeicherten Daten im Sinn einer widerspruchsfreien und vollständigen Abbildung der relevanten Aspekte des erfassten Realitätsausschnitts“ verstanden. Letztendlich bezieht sich damit die Integrität von Daten auf deren Zuverlässigkeit und Vertrauenswürdigkeit entlang des gesamten Datenlebenszyklus, als von der Erhebung über die Verarbeitung bis hin zur Speicherung. Der Begriff Datenintegrität wird dabei in zwei verschiedenen Bedeutungszusammenhängen verwendet:
Mit der Datenintegrität verfolgt das Ziel, Daten in einer Datenbank wie vom Nutzer bzw. den Nutzern geplant, zu speichern und zu einem anderen Zeitpunkt unverändert wieder abzurufen. Letztendlich soll verhindert werden, dass unbeabsichtigte Veränderungen an den Daten stattfinden.
Der Begriff der Datenintegrität wird häufig mit Datenkonsistenz gleichgesetzt. Ganz richtig ist dies nicht, denn die Konsistenz von Daten bezieht sich auf den inhaltlichen Aspekt von Daten und meint die Widerspruchsfreiheit von Daten. Also bspw., dass eine in der Datenbank abgespeicherte Person keine zwei Geburtsdaten besitzt oder über zwei Erstwohnsitze verfügen kann. Datenintegrität referenziert demzufolge auf den technischen Aspekt der Korrektheit von Daten. Etwas vollkommen andere ist die Datensicherheit: Datensicherheit ist immer in Zusammenhang mit dem Schutz von Daten zu sehen, bzw. dem Schutz vor einem unberechtigten Zugriff oder eines Verlustes von Daten.
Daten werden im Data Driven Marketing im Kern für folgende drei Zwecke benutzt:
Unabhängig davon, welchen Zweck wir uns ansehen: Die Verwendung von nicht korrekten Daten hätte fatale Auswirkungen. Entweder würden wir von einem falschen Kundenbild ausgehen oder aber ihn mit ungeeigneten Mitteln zu adressieren versuchen. Noch fataler wären inkorrekte Daten im Hinblick auf das Reporting, da wir die Bedarfsträger (z. B. Entscheider) mit falschen Informationen versorgen und diese dann ggf. falsche Entscheidungen mit hoher Tragweite und (strategischer) Relevanz treffen würden.
Die Relevanz einer Integrität der Daten lässt sich auch mittels einer vor zwei Jahren von der Beratungsgesellschaft KPMG durchgeführten Studie unter 2.190 leitenden Angestellten belegen: Der Studie zu Folge haben 25% der Befragten Vorbehalten gegenüber den eigenen Daten und Analysen und nur 35% der leitenden Angestellten weisen starkes Vertrauen auf. 92% der Befragten sind besorgt über die potenziell negativen Auswirkungen von Analysen und Daten auf ihr Unternehmen.
Das Unternehmen Varonis, ein Experte für Cybersicherheit, sieht drei wesentliche Gefahren für die Datenintegrität in einem Unternehmen:
Wir setzen uns im Folgenden vor allem mit den ersten beiden der Punkte auseinander.
Die Integrität der eigenen Daten kann mit einem dreistufigen Prozess überprüft und verbessert werden. Der erste Schritt umfasst dabei die Feststellung des Status quo: Bevor Maßnahmen ergriffen werden, muss Klarheit über den aktuellen Stand der Datenintegrität hergestellt werden. Basierend auf dem Ausgangswert (z. B. 90%) sollte ein Ziel formuliert werden, das durch das Audit erreicht werden soll. Weiterhin spielt die Kommunikation innerhalb des Teams, das für die Sammlung, Verarbeitung, Speicherung und Reporterstellung verantwortlich ist, eine große Rolle. Teamintern sollte identifiziert werden, wo die größten Gefahren für die Datenintegrität gesehen werden. Ursachen für Gefahren können bspw. bestimmte Quellen, einzelnen Prozesse oder auch Datentransfers sein.
Aufgabe im zweiten Prozessschritt ist das Herstellen eines Abgleichs zwischen den benötigten und den tatsächlich erhobenen Daten. In der Theorie stellt es zwar angesichts niedriger Kosten für Speicherplatz kein Problem dar, so viel als möglich zu erfassen. Allerdings steigt dadurch auch die Kompliziertheit des Systems an, was sich wiederum auf die Störanfälligkeit auswirkt. Insofern gilt es zu identifizieren, welche KPIs und welche Kennzahlen im Unternehmen benötigt werden. In diesem Zusammenhang gilt es auch zu hinterfragen, ob alle gemeldeten KPIs und Kennzahlen noch Relevanz besitzen oder manche einfach nur ein Relikt aus vergangenen Tagen sind, die nur aus Gewohnheit immer noch gemeldet werden. Dieser Abgleich kann jedoch nicht teamintern hergestellt werden, sondern erfordert die Einbindung der Bedarfsträger.
Im dritten Schritt geht es ans Eingemachte. Es ist zu überprüfen, ob die für die Berechnung der KPIs und Kennzahlen erforderlichen Daten korrekt erhoben, gespeichert und verarbeitet werden. Welche Daten dazu im Kern benötigt werden, hängt natürlich vom Unternehmen und gewünschten KPIs und Kennzahlen ab. K’necht schlägt u. a. die Prüfung folgender Konfigurationen vor, die in vielen Marketing-Abteilungen Relevanz besitzen dürften:
Eine hundertprozentige Datenintegrität wird sich niemals mit einem angemessenen Aufwand erreichen lassen, da auch hier das sog. Pareto-Prinzip gilt: Mit 20% Aufwand kann ein 80%iges Ergebnis erreicht werden, aber um die zu einer perfekten Lösung fehlenden 20% zu erreichen, ist ein erheblicher und meistens auch unangemessen hoher Aufwand notwendig. Allerdings sollte den Bedarfsträgern im Unternehmen kommuniziert werden, dass aktuell eine Datenintegrität von x% vorliegt.