Ein Data Warehouse ist eine zentrale, zu Analysezwecken erstellte Sammlung von Geschäftsdaten, die Organisationen bei der Entscheidungsfindung hilft. 

Data Warehouse Definition: Was ist ein Data Warehouse und woher stammen die Daten? 

Das Konzept des Data Warehouse (DWH) gibt es schon seit den 1980er-Jahren. Es wurde entwickelt, um Daten nicht mehr ausschließlich für Betriebsprozesse zu nutzen, sondern auch für Systeme, die Business Intelligence bereitstellen und damit die Entscheidungsfindung erleichtern.  

Die großen Datenmengen in Data Warehouses stammen aus unterschiedlichen Quellen, z. B.: 

  • interne Abteilungen wie Marketing, Vertrieb und Finanzen 
  • Kundenapps 
  • andere Partnersysteme 

Eine Data-Warehouse-Software bezieht regelmäßig Daten aus diesen Apps und Systemen. Anschließend durchlaufen sie Formatierungs- und Importprozesse, bei denen sie mit den bereits im Warehouse enthaltenen Informationen abgeglichen werden. Das Data Warehouse speichert die verarbeiteten Daten, damit Entscheider darauf zugreifen können. Wie häufig Daten entnommen oder wie diese formatiert werden, hängt von den Anforderungen der Organisation ab.

Laden Sie Build a True Data Lake with a Cloud Data Warehouse jetzt herunter.
Weitere Informationen

Die Vorteile eines Data-Warehouse-Systems 

Organisationen, die Data Warehouses für ihre Analysen und Business-Intelligence-Projekte nutzen, profitieren von entscheidenden Vorteilen

  • Optimale Daten: Werden Datenquellen zum Data Warehouse hinzugefügt, stellen Organisationen sicher, jederzeit konsistente und relevante Daten aus dieser Quelle zu erhalten. Sie müssen nicht befürchten, dass die Daten schwer zugänglich oder inkonsistent sind. Dies führt zu einerr besseren Datenqualität sowie Datenintegrität und gewährleistet fundierte Entscheidungen.
  • Schnellere Entscheidungen: Die Daten in Data Warehouses liegen bereits in einem konsistenten Format vor, sodass sie ohne weitere Bearbeitung analysiert werden können. DWHs verfügen auch über Analysefunktionen und möglichst vollständige Datensätze, um Entscheidungen auf harte Fakten stützen zu können. Entscheider müssen sich nicht mehr auf ihre Intuition verlassen oder aufgrund unvollständiger oder qualitativ schlechter Daten langsame und ungenaue Ergebnisse riskieren.

Was Data Warehouses nicht sind

1. Data Warehouse sind keine Datenbanken

Data Warehouses werden leicht mit Datenbanken verwechselt, dda die Konzepte gewisse Ähnlichkeiten haben. Der größte Unterschied zeigt sich jedoch bei der Analyse großer Datenmengen, auf die Data Warehouses speziell ausgelegt sind. Die folgende Übersicht verdeutlicht den Unterschied zwischen den beiden Konzepten:

 

Datenbank

Data Warehouse

Definition

Enthält für unterschiedliche Transaktionszwecke gesammelte Daten. Optimiert auf Lese- und Schreibzugriff.

Enthält aggregierte Transaktionsdaten, fie für Analysezwecke transformiert und gespeichert werden. Optimiert auf die Aggregierung und den Zugriff auf große Datensätze.

Verwendung

Datenbanken sind darauf ausgelegt, Informationen schnell zu erfassen und abzurufen.

Data Warehouses speichern Daten aus mehreren Datenbanken, um die Analyse zu vereinfachen.

Arten

Datenbanken kommen beim Data Warehousing zum Einsatz. Der Begriff bezieht sich normalerweise auf eine transaktionale Online-Verarbeitungsdatenbank. Es gibt noch weitere Arten, wie CSV, HTML und Excel-Tabellen, die für Datenbankzwecke eingesetzt werden.

Bei einem Data Warehouse handelt es sich um eine analytische Datenbank, die zu Analysezwecken auf transaktionale Datenbanken aufgesetzt wird.

2. Data Warehouses sind keine Data Lakes

Sowohl Data Lakes als auch Data Warehouses sind für Geschäftsanalysen konzipiert. Der wesentliche Unterschied besteht darin, dass Data Lakes alle Arten roher, strukturierter und unstrukturierter Daten aus sämtlichen Datenquellen in ihrem nativen Format speichern, bis sie benötigt werden. Data Warehouses legen dagegen Daten organisiert in Dateien oder Ordnern ab, sodass sie für Berichte und Datenanalysen verwendet werden können.

3. Data Warehouses sind keine Data Marts 

Data Warehouses sind in der Regel viel größer und enthalten vielfältigere Daten als Data Marts. Diese sind in ihren möglichen Anwendungsbereichen deutlich beschränkt.

Data Marts stellen häufig eine Teilansicht eines DWHs dar. Sie sind dafür gedacht, einem Nutzer bestimmte Daten für eine spezifische Anwendung auf einfache Weise bereitzustellen. Data Marts entsprechen damit quasi einem einzelnen Subjektbereich, während Data Warehouses mehrere Subjektbereiche umfassen.

Die Zukunft des Data Warehouse: Integration in die Cloud

Immer mehr Unternehmen gehen in die Cloud und nehmen ihre Datenbanken und Data-Warehouse-Tools mit. Die Cloud bietet viele Vorteile, u. a.:

  • Flexibilität 
  • Kollaboration 
  • Zugriff von überall

Beliebte Tools wie Amazon Redshift, Microsoft Azure SQL Data Warehouse, Snowflake und Google BigQuery bieten Unternehmen einen einfachen Weg zum Warehousing sowie zur Analyse ihrer Cloud-Daten.

Das Cloud-Modell senkt die Einstiegsbarrieren, die früher die Einführung und erfolgreiche Nutzung von Data-Warehousing-Technologien eingeschränkt haben – besonders in Bezug auf Kosten, Komplexität und Time-to-Value. Organisationen können damit ihre Data-Warehouse-Kapazitäten je nach Bedarf aufstocken oder reduzieren und schnell und einfach Cloud Data Warehouses starten. Dafür sind weder hohe Vorabinvestitionen noch eine zeitaufwendige Implementierung erforderlich.

Mit einem Cloud Data Warehouse gehören viele typische Risiken für lokale DWH-Datenbanken der Vergangenheit an. So bedarf es keiner Ausgaben und Budgetplanung für zusätzliche Hardware- und Softwarekäufe oder Systemupgrades. Ebenso wenig müssen Sie Geld für jährliche Wartungs- und Supportkosten zur Seite legen.

Ansehen Migrating to a Cloud Data Warehouse Architecture with AWS Redshift jetzt herunter.
Jetzt ansehen

Ein Beispiel für ein Data Warehouse

Beachbody, ein ein führender Anbieter von Fitness-, Ernährungs- und Abnehmprogrammen. Um den Erfolg seiner Kunden zu steigern und so seine Geschäftsperformance zu verbessern, sollten die Angebote besser auf die Nutzer abgestimmt und personalisiert werden.

Das Unternehmen modernisierte seine Analysearchitektur mit einem Hadoop-basierten Cloud-Data Lake auf AWS, unterstützt von Talend Real-Time Big Data. Mit dieser neuen Architektur konnte Beachbody seine Datenakquisition um das Fünffache beschleunigen und gleichzeitig die Genauigkeit seiner Datenbank für Marketingkampagnen verbessern.

Entdecken Sie die Möglichkeiten von Data-Warehouse-Systemen

Organisationen, die von einfachen Datenbanken zu Data Warehouses wechseln, können mehr aus ihren Analysen herausholen. Die Wahl des richtigen Data-Warehouse-Tools für die jeweiligen Geschäftsanforderungen entscheidet oft darüber, wie gut ein Unternehmen sein Produkt- und Serviceangebot auf seine Kunden ausrichten und sein Geschäft ausbauen kann.

Wenn Sie wissen möchten, wie Sie ein Data Warehouse für Ihr Unternehmen und Ihre Daten einrichten können, laden Sie unsere kostenlose Open-Source-Integrationssoftware Talend Open Studio herunter.