Data Warehouse
Modernisieren oder neu aufsetzen?
Müssen Fachabteilungen in Ihrem Unternehmen lange auf BI-Auswertungen warten? Möchten Sie IoT- Projekte durchführen oder neue Geschäftsmodelle entwickeln? Dann wird es höchste Zeit, einmal zu prüfen, ob Ihr Data Warehouse noch den aktuellen Anforderungen entspricht – und für künftige gewappnet ist.
Die Fähigkeit, Daten auszuwerten und daraus Erkenntnisse zu ziehen, ist heute entscheidend für den Geschäftserfolg. Voraussetzung dafür ist ein solides und gleichzeitig agiles Data Warehouse (DWH). Doch in vielen Unternehmen ist die zentrale Datenplattform schon in die Jahre gekommen und kann die aktuellen Anforderungen nicht mehr erfüllen.
Wenn Fachabteilungen tagelang auf kritische Berichte warten müssen und mit veralteten Daten arbeiten, weil Performance oder Stabilität zu wünschen übrig lassen, ist das nicht tragbar. Unternehmen stehen jetzt vor der Frage, ob es besser ist, das bestehende DWH zu modernisieren oder gleich ganz neu aufzubauen. Dabei gibt es sowohl technische als auch strategische Aspekte zu berücksichtigen. Zunächst einmal sollten Sie prüfen, ob Ihr Data Warehouse noch zeitgemäß ist und die Anforderungen der Fachabteilungen erfüllt. Wenn sich Beschwerden häufen, dass BI-Berichte zu lange dauern, deutet das auf mangelnde Performance hin. Das kann sowohl mit veralteter Hardware zusammenhängen als auch mit Problemen in der Datenbank oder Datenmodellierung.
Auch wenn es zu Stabilitätsproblemen kommt, behindert das die tägliche Arbeit. Denn damit Fachabteilungen auf die aktuellen Zahlen zugreifen können, muss das Data Warehouse kontinuierlich mit neuen Informationen gefüttert werden. Bricht der Nachladeprozess ab, können auch keine aktuellen BI-Berichte erstellt werden. Schlechte Performance und Instabilität sind die häufigsten Gründe, warum ein Data Warehouse modernisiert werden muss.
Weniger offensichtlich, aber trotzdem gravierend sind Probleme mit der Datenintegrität und Historisierung. Denn sie führen zu verfälschten Ergebnissen. Haben Sie schon einmal festgestellt, dass Daten im Data Warehouse nicht mit Daten in den Quellsystemen übereinstimmen? Wenn zum Beispiel der angezeigte Gesamtumsatz im DWH von den aggregierten Einzelbuchungen im Finanzbuchhaltungssystem abweicht, wurden vielleicht Skonto-Abzüge oder Boni nicht richtig abgebildet. Häufig hängen Datenintegritäts-Probleme damit zusammen, dass Kennzahlen und Prozesse im Data Warehouse unzulänglich dokumentiert sind. Gerade bei komplexen Strukturen, die sich über die Jahre entwickelt haben, lässt sich dann nicht mehr nachvollziehen, wie eigentlich eine Kennzahl zu Stande kommt.
Probleme mit der Historisierung treten auf, wenn sich Stammdaten ändern, aber dazu kein Zeitbezug im Data Warehouse vermerkt ist. Das führt dazu, dass historische Daten falsch zugeordnet werden. Zieht ein Kunde zum Beispiel von Köln nach Berlin, dann gelten plötzlich all seine bisherigen vermerkten Aktionen für die neue Berliner Adresse, obwohl sie ja in Köln stattfanden. Fehler in der Historisierung hängen immer mit der Datenmodellierung zusammen. Damit dies nicht passiert, müssen die Verantwortlichen die passenden Attribute für die Stammdaten im Data Warehouse anlegen und dabei auch den Zeitbezug berücksichtigen.
Zu hohe Komplexität als K.-o.-Kriterium
Ein großes Problem bei einem betagten Data Warehouse sind über die Jahre gewachsene, komplexe Strukturen. Sie wirken sich sowohl auf die Performance, Stabilität und Datenintegrität aus als auch auf künftige Entwicklungsmöglichkeiten. Als das Data Warehouse seinerzeit aufgebaut wurde, entsprach es den aktuellen Bedürfnissen. Doch im Laufe der Jahre sind kontinuierlich neue Anforderungen hinzugekommen. Folglich wurde das DWH ständig erweitert und angepasst. Wie bei einem Haus, das man einmal gebaut hat, kann man aber auch in einem Data Warehouse nicht beliebige Wände einreißen. Manchmal sind komplizierte Workarounds gefragt, um eine neue Kennzahl überhaupt noch in die gewachsene Struktur zu integrieren. Das kostet Zeit, und Fachabteilungen müssen unter Umständen lange warten, bis ihre neue Anforderung umgesetzt ist.
Mit jeder Änderung wird das Konstrukt zudem komplexer und unübersichtlicher. Manchmal werden Daten auch doppelt gespeichert, weil sie sich nicht wiederverwerten lassen. Das macht es schwer nachzuvollziehen, welche Daten für welche Berechnung herangezogen werden. Wenn diese Daten außerdem nicht auf demselben Stand sind, kommt es zu unterschiedlichen Ergebnissen. Ist ein Data Warehouse sehr komplex und unübersichtlich geworden, kann es sinnvoller sein, es lieber gleich komplett neu aufzubauen als zu modernisieren. Grundsätzlich sollte ein Data Warehouse so aufgebaut sein, dass es erweiterbar und sauber dokumentiert ist. Alle Daten, die man braucht, sollten immer an derselben Stelle zu finden sein. Sind diese Voraussetzungen erfüllt, lassen sich auch künftige Anforderungen der Fachabteilungen ohne großen Aufwand integrieren. Außerdem ist es dann möglich, ganz nach Bedarf BI-Frontend-Tools auf das Data Warehouse aufzusetzen oder auszutauschen, sodass Fachabteilungen eigenständig per Mausklick Berichte erstellen können. Das spart Zeit und entlastet die IT-Abteilung.
Zukunftsfähigkeit des DWH hängt von strategischen Fragen ab
Ob das Data Warehouse zukunftsfähig ist, hängt darüber hinaus mit strategischen Fragen zusammen. Wohin möchte sich Ihr Unternehmen in den kommenden Jahren entwickeln? Wer IoT-Projekte plant, braucht die Möglichkeit, riesige Mengen an Daten aus verschiedenen Quellen und in verschiedenen Formaten zu speichern und zu verarbeiten – darunter sowohl strukturierte Daten als auch unstrukturierte Daten wie Textdokumente oder Videos. Dafür kann es nötig sein, das Data Warehouse mit einem Data Lake zu verbinden und Tools einzusetzen, die auf beide Datenplattformen zugreifen.
Auch wer vorhat, sein Geschäftsmodell zu ändern, muss das im Data Warehouse berücksichtigen. Möchten Sie zum Beispiel Maschinen in Zukunft nicht mehr verkaufen, sondern „As a Service“ zum Mieten anbieten, dann müssen Sie ganz andere Daten erheben und im DWH abbilden – zum Beispiel Angaben darüber, wo sich eine Maschine gerade befindet, wie viele Stunden sie beim Kunden in Betrieb ist, in welchem Zustand sie ist und wann sie gewartet werden muss.
Data Warehouse muss Chefsache sein
Gerade die Frage nach künftigen Anforderungen zeigt, dass das Data Warehouse nicht nur ein IT-Thema ist, sondern eng mit der Unternehmensstrategie zusammenhängt. Deshalb sollte auch immer ein Mitglied der Geschäftsführung beteiligt sein, wenn es um die Zukunft der Datenplattform geht. Es lohnt sich, unterstützend die Expertise eines erfahrenen Beraters ins Haus zu holen. Er ermittelt in gemeinsamen Workshops und Interviews den aktuellen und künftigen Bedarf. Durch gründliche Analyse des Ist- und Soll-Zustands wird klar, ob es sich lohnt, das bestehende Data Warehouse zu modernisieren, oder ob es besser ist, es gleich neu aufzubauen.
Martin Clement, Senior Solution Architect Analytics & Data bei Axians IT Solutions / ag