Titelaufnahme

Titel
Zero-latency data warehousing : toward a zero latency event sensing and responding data warehousing / Nguyen Manh Tho
VerfasserNguyen, Manh Tho
Begutachter / BegutachterinTjoa, A Min ; Wagner, Roland
Erschienen2005
UmfangIX, 194 S. : Ill., graph. Darst.
HochschulschriftWien, Techn. Univ., Diss., 2005
Anmerkung
Zsfassung in dt. Sprache
SpracheEnglisch
Bibl. ReferenzOeBB
DokumenttypDissertation
Schlagwörter (GND)Data-Warehouse-Konzept / Echtzeitverarbeitung
URNurn:nbn:at:at-ubtuw:1-20454 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Zero-latency data warehousing [9.45 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Das drastisch zunehmende Wachstum des Datenvolumens und die Anforderungen für beschleunigte Updates in Unternehmen haben die Aufgaben von Data Warehouses signifikant verändert. Immer mehr Daten, die in immer kürzeren Intervallen anfallen, erfordern das sogennante Zero Latency Data Warehousing (Fast Echtzeit Data Warehousing) um für den Entscheidungsträger und Institutionen zeitgerechte Entscheidungen treffen zu können Das Zero-Latency Data Warehouse (ZLDWH) stellt eine weitere Stufe der Entwicklung von Data Warehouses, welche eine ganzheitliche unternehmensweite Prozeßführung eines Unternehmens unterstützt. Eine solche Prozeßführung ist durch die intelligente Prozesse, welche die Aktivitäten der Beobachtung, des Auffassens, der Vorhersage, des Reagierens und der automatischen Rückkoppelung inkludiert, charakterisiert. Das Ziel der Erreichung einer minimalen Zeitverzögerung für Entscheidungsprozesse impliziert neue Anforderungen, die zu lösen Inhalt dieser Dissertation ist. Vor allem sind dies Aspekte der operationalen Entscheidungsunterstützung, des unmittelbaren ("closed loop") Durchgriffs von Data Warehouses auf operationale Datenbanken und der automatisierten Reaktion auf besondere Zustände des Data Warehouse.

Die Dissertation behandelt den Stand der Forschung auf dem Gebiet des ZLDWH und bietet Lösungsansätze und Implementierungen in folgenden Bereichen:

- Das event-feeded Comprehensive Slowly Changing Dimension (cSCD) wird hier vorgeschlagen als eine Erweiterung der SCD Typ 2 Lösung, welche Komponenten des SCD Typ 3 beinhaltet. Ziel ist es eine vollständige Rekonstruktion historischer Daten der Dimensionsdaten u erreichen. Eine prototypische Implementierung wurde für eine sehr große T-Mobile Applikation getestet. - Das Grid-based Zero latency Data Stream Warehouse (GZLDSWH) stellt ein neuartiges Konzept dar, welches zur Erreichung der obigen Ziele für sogenannte Data Streams die Grid-Computing-Technologie anwendet. Das GZLDSDWH ist aufgebaut auf Grid-Services des Open Grid Service Infrastructure (OGSI) und Globus Toolkit 3 (GT3). - Die Sense & Response Service Architecture (SARESA) wurde hier entwickelt um eine Rückkoppelung zwischen Analyse im Data Warehouse und den notwendigen operationalen Aktivitäten zu erreichen. Der vorgestellte Ansatz ermöglicht eine beinahe Echtszeitreaktion basierend auf Analysen der Data Warehouse Informationen durch automatische Trigger und Entscheidungsempfehlungen, welche die Zeitspanne zwischen Analyse und Prozeßaktivität erheblich verkürzt. Eine prototypische Implementierung für die Auffindung von Berügereien für T-Mobile wird hier vorgestellt.

Schließlich werden mögliche Zukunftsentwicklungen für Nicht-Standard.Anwendungen skizziert um auch hier die Notwendigkeit von Fast-Echtzeit-Ansätzen zu dokumentieren.

Zusammenfassung (Englisch)

Increased data volumes and accelerating update speeds are fundamentally changing the role of the data warehouse in modern businesses. More data, coming in faster, and requiring immediate conversion into decisions means that organizations are confronting the need for zero-latency Data Warehousing.

The Zero-Latency Data Warehouse (ZLDWH) is an extended stage in the data warehouse development, which will enable a complete business intelligence process to observe, understand, predict, react to, reorganize, monitor, automate and control feedback loops in the minimal latency. With the aim to decrease the time it takes to make a business decision, ZLDWH must satisfy some new requirements of the speed driven business such as operational decision support, closed-loop integrated analytics, and automated reaction. This doctoral thesis reviews the start-of-the-art of the Zero-Latency Data Warehouse and investigates several approaches towards its implementations:

- The event-feeded Comprehensive Slowly Changing Dimension (cSCD). We propose an extended event-oriented SCD solution which is mixed from SCD type 2 and type 3 to validate the event-messages and reconstruct the complete history of the dimension. The solution could be applied to any dimension data, allow the user to execute the well-performing queries on both historical and current state of dimension. The prototype package is implemented and tested at T-Mobile Austria.

- The Grid-based Zero-Latency Data Stream Warehouse (GZLDSWH). We present a framework of building a Grid-based Zero-Latency Data Stream Warehouse to tackle the resource limitation issues in data stream processing without using approximation approaches. The GZLDSWH is built upon a set of Open Grid Service Infrastructure (OGSI)-based services and Globus Toolkit 3 (GT3) with the capability of capturing and storing continuous data streams, performing analytical processing, and reacting autonomously in near real time to some kinds of events based on well-established Knowledge Base.

- Sense & Response Service Architecture (SARESA). We introduce Sense & Respond loops that support a complete Business Intelligence process to sense, interpret, predict, automate and respond to business processes.

Our approach enables real-time analytics across corporate processes, notifies with actionable recommendations or automatically triggers, effectively closing the gap between Business Intelligence systems and business processes. We also describe the prototype implementation applied in the Mobile Phone Fraud Detection application.

Finally, we mention some future trends of non-standard Data Warehousing applications and discuss about the important role of zero-latency data warehouses techniques which could be applicable in these emerging Data Warehousing applications.