left top pattrenright top pattren
November 17, 2022

„Liebling, ich habe unseren Daten gepimpt“ – oder: Wie komme ich zu einer besseren Datenintegrität?

Data Driven Marketing bedeutet unter anderem, Entscheidungen nicht mehr basierend auf einem Bauchgefühl zu treffen, sondern auf Daten abzustützen und damit zu fundieren. So weit, so gut. Nur: Wie fundiert kann eine Entscheidung sein, wenn die der Entscheidung zu Grunde liegenden Daten fehlerhaft sind? An diesem Punkt setzt der folgende Beitrag an, indem er sich mit der Bedeutung von und Wegen zur Gewährleistung einer Integrität von Daten auseinandersetzt.

Datenintegrität – was ist das genau?

Unter Datenintegrität wird laut Gablers Wirtschaftslexikon die „Korrektheit der gespeicherten Daten im Sinn einer widerspruchsfreien und vollständigen Abbildung der relevanten Aspekte des erfassten Realitätsausschnitts“ verstanden. Letztendlich bezieht sich damit die Integrität von Daten auf deren Zuverlässigkeit und Vertrauenswürdigkeit entlang des gesamten Datenlebenszyklus, als von der Erhebung über die Verarbeitung bis hin zur Speicherung. Der Begriff Datenintegrität wird dabei in zwei verschiedenen Bedeutungszusammenhängen verwendet:

  • Datenintegrität als Zustandsbeschreibung: In dieser Bedeutung bezieht sich der Begriff auf die Eigenschaft bzw. die Eigenschaften der Daten selbst. Eine Integrität kann also vorhanden oder nicht vorhanden sein.
  • Datenintegrität als Prozess: Die zweite Wortbedeutung bezieht sich auf den Prozess der Herstellung einer Integrität von Daten. Eine Überprüfung auf Fehler oder eine Validierung sind mögliche Vorgehensweisen zur Herstellung dieser Integrität.

Mit der Datenintegrität verfolgt das Ziel, Daten in einer Datenbank wie vom Nutzer bzw. den Nutzern geplant, zu speichern und zu einem anderen Zeitpunkt unverändert wieder abzurufen. Letztendlich soll verhindert werden, dass unbeabsichtigte Veränderungen an den Daten stattfinden.

Das Trio Datenintegrität, Datenkonsistenz und Datensicherheit

Der Begriff der Datenintegrität wird häufig mit Datenkonsistenz gleichgesetzt. Ganz richtig ist dies nicht, denn die Konsistenz von Daten bezieht sich auf den inhaltlichen Aspekt von Daten und meint die Widerspruchsfreiheit von Daten. Also bspw., dass eine in der Datenbank abgespeicherte Person keine zwei Geburtsdaten besitzt oder über zwei Erstwohnsitze verfügen kann. Datenintegrität referenziert demzufolge auf den technischen Aspekt der Korrektheit von Daten. Etwas vollkommen andere ist die Datensicherheit: Datensicherheit ist immer in Zusammenhang mit dem Schutz von Daten zu sehen, bzw. dem Schutz vor einem unberechtigten Zugriff oder eines Verlustes von Daten.

Bedeutung der Datenintegrität im Data Driven Marketing

Daten werden im Data Driven Marketing im Kern für folgende drei Zwecke benutzt:

  • Schaffung eines Verständnisses vom Kunden, z. B. im Hinblick auf seine Einstellung, seine Absichten, seine Erwartungen, Bedürfnisse oder sein Verhalten,
  • Adressierung aktueller oder potenzieller Kunden durch unterschiedliche Maßnahmen,
  • Verfassen von Dokumentationen und Reports.

Unabhängig davon, welchen Zweck wir uns ansehen: Die Verwendung von nicht korrekten Daten hätte fatale Auswirkungen. Entweder würden wir von einem falschen Kundenbild ausgehen oder aber ihn mit ungeeigneten Mitteln zu adressieren versuchen. Noch fataler wären inkorrekte Daten im Hinblick auf das Reporting, da wir die Bedarfsträger (z. B. Entscheider) mit falschen Informationen versorgen und diese dann ggf. falsche Entscheidungen mit hoher Tragweite und (strategischer) Relevanz treffen würden.

Die Relevanz einer Integrität der Daten lässt sich auch mittels einer vor zwei Jahren von der Beratungsgesellschaft KPMG durchgeführten Studie unter 2.190 leitenden Angestellten belegen: Der Studie zu Folge haben 25% der Befragten Vorbehalten gegenüber den eigenen Daten und Analysen und nur 35% der leitenden Angestellten weisen starkes Vertrauen auf. 92% der Befragten sind besorgt über die potenziell negativen Auswirkungen von Analysen und Daten auf ihr Unternehmen.

Was sind die größten Gefahren für eine Datenintegrität im Online Marketing?

Das Unternehmen Varonis, ein Experte für Cybersicherheit, sieht drei wesentliche Gefahren für die Datenintegrität in einem Unternehmen:

  • Fehler bei der Übertragung von Daten (z. B. beim Austausch von Daten zwischen Unternehmensbereichen),
  • Mangelhafte Konfiguration von Hardware und Sicherheitsfehler,
  • Gezielte Angriffe auf die Daten des Unternehmens von außerhalb oder durch eigene Angestellte.

Wir setzen uns im Folgenden vor allem mit den ersten beiden der Punkte auseinander.

Wie überprüfen wir die Integrität unserer Marketing-Daten?

Die Integrität der eigenen Daten kann mit einem dreistufigen Prozess überprüft und verbessert werden. Der erste Schritt umfasst dabei die Feststellung des Status quo: Bevor Maßnahmen ergriffen werden, muss Klarheit über den aktuellen Stand der Datenintegrität hergestellt werden. Basierend auf dem Ausgangswert (z. B. 90%) sollte ein Ziel formuliert werden, das durch das Audit erreicht werden soll. Weiterhin spielt die Kommunikation innerhalb des Teams, das für die Sammlung, Verarbeitung, Speicherung und Reporterstellung verantwortlich ist, eine große Rolle. Teamintern sollte identifiziert werden, wo die größten Gefahren für die Datenintegrität gesehen werden. Ursachen für Gefahren können bspw. bestimmte Quellen, einzelnen Prozesse oder auch Datentransfers sein.

Aufgabe im zweiten Prozessschritt ist das Herstellen eines Abgleichs zwischen den benötigten und den tatsächlich erhobenen Daten. In der Theorie stellt es zwar angesichts niedriger Kosten für Speicherplatz kein Problem dar, so viel als möglich zu erfassen. Allerdings steigt dadurch auch die Kompliziertheit des Systems an, was sich wiederum auf die Störanfälligkeit auswirkt. Insofern gilt es zu identifizieren, welche KPIs und welche Kennzahlen im Unternehmen benötigt werden. In diesem Zusammenhang gilt es auch zu hinterfragen, ob alle gemeldeten KPIs und Kennzahlen noch Relevanz besitzen oder manche einfach nur ein Relikt aus vergangenen Tagen sind, die nur aus Gewohnheit immer noch gemeldet werden. Dieser Abgleich kann jedoch nicht teamintern hergestellt werden, sondern erfordert die Einbindung der Bedarfsträger.

Im dritten Schritt geht es ans Eingemachte. Es ist zu überprüfen, ob die für die Berechnung der KPIs und Kennzahlen erforderlichen Daten korrekt erhoben, gespeichert und verarbeitet werden. Welche Daten dazu im Kern benötigt werden, hängt natürlich vom Unternehmen und gewünschten KPIs und Kennzahlen ab. K’necht schlägt u. a. die Prüfung folgender Konfigurationen vor, die in vielen Marketing-Abteilungen Relevanz besitzen dürften:

  • Überprüfung des Google Analytics Code bzw. des Tag Manager Codes auf korrekte Installation: Häufig ist der Code an der falschen Stelle auf der Seite platziert, nicht auf allen Seiten verfügbar oder aber nicht richtig konfiguriert. Also Folge können die Besucherdaten nicht richtig erfasst und bspw. Käufe gar nicht oder mehrmals gezählt werden,
  • Überprüfung der Zugriffsrechte auf Programme wie z. B. Google Analytics oder Google Ads: Häufig besitzen ehemalige Angestellte, die entweder innerhalb des Unternehmens gewechselt haben oder das Unternehmen bereits verlassen haben, Zugriff auf diese Programme und die Daten. Letztendlich sollte in diesem Kontext ein Prozess etabliert werden, der den Analytics Manager über den Fortgang eines Mitarbeiters informiert, sodass dessen Zugriff gesperrt werden kann,
  • Überprüfung der gesetzten Filter: Filter stellen ein häufig genutztes Tool bei Auswertungstools wie Google Analytics dar. Während die meisten Filter nur selten überprüft werden müssen, sollten bspw. IP-Filter regelmäßiger (z. B. alle sechs Monate) reviewed werden. Da sich IP-Adressen regelmäßig ändern, sollte durch die Überprüfung sichergestellt werden, dass die Bots von Suchmaschinen oder Drittanbietern nicht als Besucher der Seite gezählt werden.
  • Durchführen eines Abgleiches zwischen Webanalytics und E-Commerce-Daten: Bei vielen Unternehmen sind Unstimmigkeiten zwischen den Webanalytics-Werten und den im ERP-System erhobenen Daten festzustellen (z. B. Anzahl der Käufe oder Umsatz durch diese Verkäufe). Zur Überprüfung der Integrität sollte ein Vergleich zwischen den Webanalytics- und den E-Commerce-Werten aus dem ERP-System vorgenommen werden. Bei einer Übereinstimmung von mehr als 90% kannst du dich zurücklehnen, bei Abweichungen von mehr als 20% sollte den Ursachen auf den Grund gegangen werden.

Zusammenfassung

Eine hundertprozentige Datenintegrität wird sich niemals mit einem angemessenen Aufwand erreichen lassen, da auch hier das sog. Pareto-Prinzip gilt: Mit 20% Aufwand kann ein 80%iges Ergebnis erreicht werden, aber um die zu einer perfekten Lösung fehlenden 20% zu erreichen, ist ein erheblicher und meistens auch unangemessen hoher Aufwand notwendig. Allerdings sollte den Bedarfsträgern im Unternehmen kommuniziert werden, dass aktuell eine Datenintegrität von x% vorliegt.

Heading 1

Heading 2

Heading 3

Heading 4

Heading 5
Heading 6

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.

Block quote

Ordered list

  1. Item 1
  2. Item 2
  3. Item 3

Unordered list

  • Item A
  • Item B
  • Item C

Text link

Bold text

Emphasis

Superscript

Subscript

Heading 1

Heading 2

Heading 3

Heading 4

Heading 5
Heading 6

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.

Block quote

Ordered list

  1. Item 1
  2. Item 2
  3. Item 3

Unordered list

  • Item A
  • Item B
  • Item C

Text link

Bold text

Emphasis

Superscript

Subscript

Heading 1

Heading 2

iuhiuhjijh

Heading 3

Heading 4

Heading 5
Heading 6

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.

Block quote

Ordered list

  1. Item 1
  2. Item 2
  3. Item 3

Unordered list

  • Item A
  • Item B
  • Item C

Text link

Bold text

Emphasis

Superscript

ijhkjhkj

Subscript

Heading 1

Heading 2

Heading 3

Heading 4

Heading 5
Heading 6

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.

Block quote

Ordered list

  1. Item 1
  2. Item 2
  3. Item 3

Unordered list

  • Item A
  • Item B
  • Item C

Text link

Bold text

Emphasis

Superscript

Subscript