Titelaufnahme

Titel
Replication techniques for balancing data integrity with availability / Johannes Osrael
VerfasserOsrael, Johannes
Begutachter / BegutachterinJazayeri , Mehdi ; Kappel, Gertrude
Erschienen2007
UmfangVIII, 96 Bl. : graph. Darst.
HochschulschriftWien, Techn. Univ., Diss., 2007
Anmerkung
Zsfassung in dt. Sprache
SpracheEnglisch
Bibl. ReferenzOeBB
DokumenttypDissertation
Schlagwörter (DE)Replikation / Datenintegrität / Verfügbarkeit / Middleware
Schlagwörter (EN)replication / data integrity / availability / middleware
Schlagwörter (GND)Datenreplikation / Verfügbarkeit / Konsistenz <Informatik> / Middleware
URNurn:nbn:at:at-ubtuw:1-15571 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Replication techniques for balancing data integrity with availability [1.64 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Replikation wird in verteilten Systemen zur Verbesserung der Verfügbarkeit und Performanz verwendet. Die Konsistenz der Replikate und die Einhaltung der Datenintegrität (Konsistenz bezüglich von Integritätsbedingungen) sind Korrektheitskriterien in datenzentrierten verteilten Systemen. Falls Konsistenz immer eingehalten werden muss, verschlechtert sich die Verfügbarkeit des Systems in Fehlersituationen (Verbindungsfehler, Rechnerausfälle).

Es gibt jedoch Systeme (z.B. in der Flugsicherung) in denen die Konsistenz temporär in Fehlersitutationen abgeschwächt werden kann, um die Verfügbarkeit zu erhöhen. Das heißt, Verfügbarkeit und Konsistenz können gegeneinander balanciert werden. Dies erfordert jedoch Reparaturmaßnahmen, wenn Netzwerkpartitionen wieder zusammengefügt werden. D.h., mit Hilfe von Reconciliation-Protokollen muss sowohl die Konsistenz der Replikate als auch die Datenintegrität wiederhergestellt werden.

Der Hauptfokus dieser Dissertation liegt auf Replikationstechniken, welche die Steuerung des Zusammenspiels zwischen Verfügbarkeit und Konsistenz ermöglichen. Ein zweiter Fokus liegt auf Replikationstechniken für datenzentrierte service-orientierte Systeme. Die Dissertation besteht daher aus drei Hauptteilen:

Erstens wird ein Replikationsmodell für die Balancierung von Verfügbarkeit und Konsistenz vorgestellt, das sogenannte Availability/Consistency Balancing Replication Model (ACBRM).

Zweitens wird Adaptive Voting präsentiert, ein konkretes Replikationsprotokoll, welches dem abstrakten Replikationsmodell folgt. Sowohl eine Analyse der Verfügbarkeit als auch eine Prototyp-Implementierung zeigen die Sinnhaftigkeit des Ansatzes, inbesonders wenn (i) eine signifikante Anzahl an Integritätsbedingungen aufweichbar ist und (ii) die Zeit zur Wiederherstellung der Konsistenz kürzer ist als die Zeit, in der Fehler auftraten.

Drittens werden Replikationsmiddleware für verteilte Objektsysteme (z.B. die auf das ACBRM zugeschnittene DeDiSys Middleware) und Replikations-middleware für service-orientierte Systeme auf Architekturebene verglichen. Basierend auf dieser Analyse und Erfahrungen mit unseren Prototypen stammt die Schlussfolgerung, dass viele etablierte Middleware-Architekturen in service-orientierten Systemen wiederverwendet werden können.

Zukünftige Arbeiten sollten sich auf Techniken zur Erreichung von Sicherheit und Zuverlässigkeit in service-orientierten Systemen fixieren, die durch Heterogenität, hohe Skalierbarkeitsanforderungen, und Dynamik charakterisiert sind.

Zusammenfassung (Englisch)

Replication is used in distributed systems to achieve higher availability and/or performance. Correctness criteria for data-centric distributed systems are replica consistency and data integrity (also called constraint consistency). If consistency needs to be ensured all times, such systems soon become (partially) unavailable if node and link failures occur. However, there exist applications (e.g., in air traffic control) in which consistency can be temporarily relaxed during degraded situations in order to achieve higher availability. Thus, consistency can be balanced against availability. This in turn requires repair actions after reunification of network partitions. That is, reconciliation is necessary to re-establish replica consistency and data integrity when the system becomes healthy again.

The main focus of this thesis is on replication techniques for controlling this trade-off in distributed object systems; a secondary focus is on replication techniques for data-centric service oriented systems. Thus, the contribution of this thesis is three-fold:

First, we introduce an enhanced replication model for trading data integrity against availability - the Availability/Consistency Balancing Replication Model (ACBRM).

Second, we present Adaptive Voting - a concrete protocol that realizes the abstract model. Both an analytical availability analysis and a prototype implementation show the feasibility of the approach, especially if (i) a significant portion of data integrity constraints of the system is relaxable and (ii) reconciliation time is shorter than degradation time.

Third, distributed object replication middleware systems (e.g., the DeDiSys middleware which is targeted to the ACBRM) and service replication middleware systems are compared on an architectural level. From this analysis and experiences with our middleware prototypes we conclude that many well-established replication middleware architectures can be reapplied in service oriented systems.

Future work needs to focus on dependability and security techniques for service oriented systems of the future characterized by cross-organizational heterogeneity, massive scale, and dynamicity.