Die Beschleunigung der Datenanalyse durch organisatorische Verankerung der Datenvereinheitlichung

Einen großen Teil meiner Consultingtätigkeit nimmt Datenanalyse ein. Bis ich zur eigentlichen Analyse gelange müssen die Daten jedoch im Regelfall erst zur Verfügung gestellt und vorbereitet werden. Datenanalyse lässt sich ein bisschen mit dem Bergsteigen vergleichen. Lange geht es mühsam den Berg hoch und am Schluss steht man am Gipfel. So ist es in der Datenanalyse mit der Datenaufbereitung, welche den mühsamen Weg hinauf erfordert. Erst am Schluss entstehen neue Erkenntnisse. Es gibt unterschiedliche Prozentzahlen darüber, welchen Anteil die Datenvorbereitung einnimmt. Nach meiner Schätzung ist der Anteil in den letzten Jahren vielleicht etwas gesunken, weil BI- und Analytics-Tools zunehmend mehr Aufbereitungsaufgaben mit weniger Handgriffen ermöglichen, als dies z. B. rein auf SQL- oder Code-Ebene möglich ist.

Warum hat sich das Ausmaß der Vorbereitungstätigkeit kaum reduziert?

Typischerweise werden folgende vier Probleme gelöst bzw. bereinigt:

  1. Datentyp Text
    Der Datentyp Text ist ein Dauerbrenner für Probleme. Das gleiche Produkt wird unterschiedlich geschrieben, weil unterschiedliche Personen Informationen eintragen oder sich jemand verschreibt

     

  2. Unterschiedliche Felder oder Feldtypen (Text, Auswahlfeld, etc.)
    Unterschiedliche Felder oder Feldtypen werden für das gleiche in unterschiedlichen Datensilos verwendet oder gleiche Auswahlfelder werden mit unterschiedlichen Auswahlmöglichkeiten in unterschiedlichen Datensilos genutzt

     

  3. Unterschiedliche Datenhierarchien zwischen Datensilos
    Zum Beispiel: Abteilung A hat die Produkthierarchie anders aufgebaut als Abteilung B

     

  4. Historisierung von Daten entspricht nicht dem Analysezweck
    Daten liegen nicht historisiert vor, obwohl man sie historisiert bräuchte. In vielen Firmen liegen beispielsweise Daten über große Werbemaßnahmen zumindest teilweise nicht entsprechend strukturiert vor. Sie sind meist in Excel-Tabellen abgelegt und nicht im DWH.
     

Datensilos

Ein Datensilo ist eine Sammlung von Daten, die sich im Besitz einer Gruppe befindet und auf die andere Gruppen im selben Unternehmen nicht einfach oder nicht vollständig zugreifen können. Finanz-, Verwaltungs-, Personal-, Marketing- und andere Abteilungen benötigen unterschiedliche Informationen, um ihre Arbeit zu erledigen. Diese verschiedenen Abteilungen neigen dazu, ihre Daten an getrennten Orten zu speichern, die als Daten- oder Informationssilos bekannt sind. Somit befinden sich Daten auch in unterschiedlichen Systemen.

Nutzen der Datenvereinheitlichung

Daten sind dann am produktivsten, wenn sie im gesamten Unternehmen zugänglich und leicht verständlich sind. Wenn Daten nicht leicht zu finden sowie zeitnah zu nutzen sind oder wenn man ihnen nicht trauen kann bringen sie keinen Mehrwert für Analysen und Entscheidungsprozesse. Ein Unternehmen, das digitalisiert, ohne die Datensilos aufzubrechen, wird die Vorteile der digitalen Transformation nicht voll ausschöpfen können. Um wirklich datengesteuert zu werden, müssen Unternehmen den Entscheidungsträgern eine 360-Grad-Sicht auf Daten bieten, die für ihre Analysen relevant sind.

 

So entstehen Datensilos

Datensilos entstehen im Laufe der Zeit auf natürliche Weise und spiegeln die Organisationsstrukturen wider. Da jede Abteilung ihre eigenen Daten für ihre eigenen Zwecke sammelt und speichert, entsteht ihr eigenes Datensilo. Die meisten Unternehmen können das Problem u.a. auf die folgenden Ursachen für Datensilos zurückführen:

Strukturell: Softwareanwendungen werden zu einem bestimmten Zeitpunkt für eine bestimmte Gruppe im Unternehmen geschrieben. In einer Welt mit begrenzten Ressourcen werden die Anwendungen für ihre Hauptfunktion optimiert und stehen nur einem begrenzten Nutzerkreis zur Verfügung

Historisch: Jedes langlebige Unternehmen ist über mehrere Generationen von Führungskräften, Philosophien und Übernahmen gewachsen, was zu einer Vielzahl inkompatibler Systeme geführt hat.

Technologisch: Software-Anbieter gehören zu den ersten, die wissen, dass der Zugang zu Daten Macht bedeutet. Ihre Strategien können den Wunsch der Nutzer, die in den Anwendungen enthaltenen Daten mit anderen Systemen und Daten zu verknüpfen, zunichtemachen.

 

Nachteile von Datensilos

Datensilos stellen ein Hindernis für den Erfolg dar. Hier sind vier häufige Gründe, warum Datensilos Unternehmen schaden:

  1. Datensilos schränken die Sicht auf die Daten ein.
    Silos verhindern, dass relevante Daten gemeinsam genutzt werden können.
  1. Datensilos gefährden die Datenintegrität.
    Bei Datensilos werden dieselben Informationen oft in verschiedenen Datenbanken gespeichert, was zu Inkonsistenzen zwischen den Daten der einzelnen Abteilungen führt.
  1. Datensilos verschwenden Ressourcen.
    Wenn dieselben Informationen an verschiedenen Orten gespeichert werden und Benutzer die Daten in ihren persönlichen oder gemeinsamen Speicher herunterladen gehen Ressourcen verloren.
  1. Datensilos erschweren die gemeinsame Arbeit.
    Wird die gemeinsame Nutzung von Daten schwierig oder unmöglich, so leidet auch die Fähigkeit zur Zusammenarbeit.

Immer wieder neue Datensilos

Warum gibt es noch immer Datensilos? Die Erkenntnis, dass Datensilos schädlich sind, ist schon etliche Jahre alt. Obwohl dies bekannt ist, kämpfen viele Unternehmen nach wie vor mit Datensilos und Dateninkonsistenzen. Weiters ist das Potenzial der gemeinsamen Nutzung von Unternehmensdaten nicht voll ausgeschöpft, da nicht alle Mitarbeiter Zugang zu relevanten Daten haben.

Wo liegt das Problem? Es besteht eine Wechselwirkung zwischen Datensilos und der automatisierten Verarbeitung von Prozessen. Wie oben erwähnt werden immer wieder Systeme in Unternehmensbereiche abgelöst, um Prozesse zu optimieren und sie zu digitalisieren.

Die Qual der Wahl

Bei der Wahl des Anbieters stehen Unternehmen vor folgendem Dilemma:

Ein Softwareanbieter
Decken sie alle Aufgaben mit den Systemen eines Softwareanbieter ab, begeben sie sich stark in Abhängigkeit von diesem einen Software-Anbieter. Die Software-Systeme arbeiten allerdings im Regelfall besser zusammen. Sie sind also besser integriert. Oft wird dann jedoch nicht die für den Unternehmensbereich beste Softwarelösung eingesetzt, weil auch große Software-Anbieter nicht in allen Unternehmensaufgaben gleich stark aufgestellt sind.

Unterschiedliche Hersteller
Nimmt man die Software von unterschiedlichen Herstellern, also für jeden Unternehmensbereich das vermeintlich Beste, entstehen im Regelfall stärkere Datensilos als im obigen Fall. Man muss sich nicht nur einmalig, sondern laufend, also auch noch nach Jahren um die Integration kümmern, da die unterschiedlichen Softwareanbieter divergierende Roadmaps umsetzen. Die betrifft sowohl Prozesse als auch die Datenvereinheitlichung.

 

Was ist die Lösung?

 

  1. Zeigen Sie Verbesserungspotenzial auf
    Kommunizieren Sie die Vorteile der gemeinsamen Datennutzung und der Datenintegrität sowie die Probleme mit Silos an die Belegschaft und ermöglichen Sie den Data-Analysten der Abteilungen auch weitgehende Zugriffe auf gemeinsame Daten im DWH. Diese sollten oft auch mit SQL- und BI-Tools ausgestattet werden, damit Lade- und Aufbereitungsprozess im kleineren Ausmaß selbst durchgeführt werden und die IT entlastet wird. Dadurch werden Data-Analysten auch gute Ansprechpartner für die IT-Abteilung.
  1. Verankern Sie die gemeinsame Datennutzung in der Unternehmensstruktur
    Stellen Sie die gemeinsame Datennutzung durch Verankerung in der Unternehmensstruktur sicher. Dies wird am besten durch weitgehende Verlinkung von Prozess- und Data Management bewerkstelligt. In den betreffenden Abteilungen verfügen Spezialisten oft über eine tiefere spezifische Kompetenz zu den Prozessen der Abteilung. Verankern Sie die Dokumentation der Datenvereinheitlichung sowie die gemeinsame Speicherung an der Dokumentation des Prozessmanagements, so dass Prozesse und Datenzusammenführungen gemeinsam von Fachabteilung, IT, Prozessmanager und Analysten dokumentiert und geplant werden.

Technisch erfolgt die Zusammenführung oft über ETL- (Extrahieren, Transformieren und Laden) und BI-Tools, welche den Prozess der Übertragung von Daten aus verschiedenen Quellen in das Data Warehouse automatisieren. Diese Aufgaben sind am besten gleich nach der Prozessmodellierung ebenfalls zumindest grob zu designen und parallel zur Verfeinerung der Prozessmodellierung genauer zu definieren.

Sobald Sie Ihre Daten zentralisiert haben, ist es an der Zeit, Governance-Standards zur Berechtigung festzulegen, um sicherzustellen, dass die Daten ordnungsgemäß verwendet werden und keine neuen Silos entstehen.

Wenn die Daten strukturiert vorliegen, ist es gar nicht so schwer den Gipfel zu erklimmen, bzw. die eigentliche Datenanalyse bis hin zur Präsentation zurück zu legen.

 

 Autor: Elmar Rudelstorfer

Quellen: 

https://www.forbes.com/sites/forbesagencycouncil/2019/10/01/the-age-of-analytics-and-the-importance-of-data-quality/?sh=5560e9d25c3c

https://basis.net/blog/marketing-data-silos

https://www.forbes.com/sites/gilpress/2016/03/23/data-preparation-most-time-consuming-least-enjoyable-data-science-task-survey-says/?sh=688a72e46f63