Bibliographic Metadata

Title
Dynamic Optimization of Data Object Placement in the Cloud / von Johannes Matt
Additional Titles
Dynamic Optimization of Data Object Placement in the Cloud
AuthorMatt, Johannes
CensorSchulte, Stefan ; Waibel, Philipp
PublishedWien, 2017
Description111 Seiten
Institutional NoteTechnische Universität Wien, Diplomarbeit, 2017
Annotation
Arbeit an der Bibliothek noch nicht eingelangt - Daten nicht geprueft
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers
LanguageEnglish
Document typeThesis (Diplom)
Keywords (DE)Redundante Datenspeicherung / Cloud-Speicher / Kostenoptimierung
Keywords (EN)Redundant Data Storage / Cloud Storages / Cost Optimization
URNurn:nbn:at:at-ubtuw:1-99106 Persistent Identifier (URN)
Restriction-Information
 The work is publicly available
Files
Dynamic Optimization of Data Object Placement in the Cloud [1.54 mb]
Links
Reference
Classification
Abstract (German)

In den letzten Jahren sind Cloud-basierte Speicherlösungen zu einer weit verbreiteten Alternative zu lokalen Speichersystemen geworden. Benutzer von Cloud-basierten Speichersystemen können von einigen Vorteilen profitieren. Einige dieser Vorteile sind die bessere Verfügbarkeit, erweiterte Langlebigkeit und die geringeren IT-Administrationskosten. Allerdings gibt es auch einige Nachteile, die bei der Verwendung von Cloud-basierten Speichern berücksichtigt werden müssen, beispielsweise das Vendor-Lock-In Problem und die mögliche Nichtverfügbarkeit der Daten. Um diese Probleme zu vermeiden, entwerfen wir in dieser Arbeit ein Systemmodell, das mehrere Cloud-Speicher für das Speichern der Daten verwendet. Durch die Verwendung dieses Modells ergibt sich die Möglichkeit, Daten redundant zu speichern und die günstigste Speicherlösung zu finden. In dieser Arbeit formulieren wir ein globales Optimierungsproblem, welches historische Zugangsinformationen über die Daten in Betracht zieht und dabei vorgegebene Dienstgüteanforderungen erfüllt, um eine kosteneffiziente Speicherlösung zu finden. Außerdem stellen wir einen hochskalierbaren heuristischen Ansatz vor, mit dem große Datenmengen verarbeitet werden können. Die Heuristik ermöglicht es, eine Speicherlösung zu finden, die im Hinblick auf die Kosteneffizienz nahe an die optimale Lösung der globalen Optimierung herankommt. Weiters beschreiben wir einen Ansatz, welcher Latenzen in Betracht zieht. Dieser Ansatz berücksichtigt die Latenzen der verschiedenen Cloud-Speicher bei der Optimierung der Speicherlösung. Dabei wird das Ziel verfolgt, zusätzlich zu einer Kostenreduktion auch möglichst geringe Latenzen zu erreichen, was schlussendlich zu einer besseren Benutzererfahrung führt. Wir evaluieren alle drei Optimierungsansätze gründlich und zeigen damit die Vorteile der entwickelten Ansätze auf. Für die Evaluierungen vergleichen wir unsere Optimierungsansätze mit einem gängigen Standardansatz. Wir erklären die korrekte Funktionsweise der Optimierungsansätze in einer detaillierten Analyse der Resultate. Dabei zeigen wir, dass wir mehr als 35% der gesamten Speicherkosten im Vergleich zu dem gängigen Standardansatz einsparen können.

Abstract (English)

The use of cloud-based storages to store data has become a popular alternative to traditional local storage systems. Users of cloud-based storages can benefit from a lot of advantages, such as higher data availability, extended durability and lower IT administration cost. However, there also exist drawbacks in using cloud-based storage systems. Among the biggest drawbacks are the problem of vendor lock-in and possible unavailability of the data. To overcome these problems, in this thesis we formulate a system model that makes use of multiple cloud storages to store data. The usage of this system model allows the redundant storage of data and aims at finding the cheapest possible storage solution. In this thesis we formulate a global optimization problem that takes into account historical data access information and ensures predefined Quality of Service requirements to find a cost-efficient storage solution. Furthermore, we present a highly scalable heuristic approach that can be used with big amounts of data. The heuristic approach aims at scalability while still providing a cost-efficient storage solution that comes close to the optimal solution provided by the global optimization. As an extension to the heuristic approach we also describe a latency consideration approach. This approach incorporates latencies between the middleware and the used cloud storages into the optimization in order to find a storage solution that offers the lowest possible latencies. Therefore, customers can access their data faster which leads to a better end-user experience. We extensively evaluate all three optimization approaches and thereby show the benefits of our designed approaches. The evaluations are presented by comparing our optimization approaches to a baseline that follows a state-of-the-art approach. We prove the correct functionality of the approaches by a detailed analysis of the results and show that we save more than 35% of total cost in comparison with the baseline.