Bibliographic Metadata

Title
Theoretical and practical aspects in compositional data analysis / von Dipl.-Ing. Mehmet Can Mert
Additional Titles
Theoretische und praktische Aspekte bei der Analyse von Kompositionsdaten
AuthorMert, Mehmet Can
CensorFilzmoser, Peter
PublishedWien, Dezember 2016
Descriptionxi, 96 Blätter : Illustrationen, Diagramme
Institutional NoteTechnische Universität Wien, Dissertation, 2016
Annotation
Zusammenfassung in deutscher Sprache
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers
LanguageEnglish
Bibl. ReferenceOeBB
Document typeDissertation (PhD)
Keywords (DE)error propagation / balances / risk rate
Keywords (EN)error propagation / balances / risk rate
Keywords (GND)Datenanalyse / Variable / Verknüpfung <Mathematik> / Geochemie / Epidemiologie
URNurn:nbn:at:at-ubtuw:1-7065 Persistent Identifier (URN)
Restriction-Information
 The work is publicly available
Files
Theoretical and practical aspects in compositional data analysis [3.43 mb]
Links
Reference
Classification
Abstract (German)

Kompositionsdaten stellen die relative Information zwischen den Variablen, die Teile eines Ganzen sind, dar. Die relevante Information ist nicht in den absoluten Werten enthalten, sondern in den Verhältnissen der kompositionellen Variablen. Diese relative Information kann mit dem in den 1980er Jahren vorgeschlagenen Log-Ratio Ansatz analysiert werden. Aus geometrischer Sicht befinden sich die Kompositionsdaten im Simplex, einer Teilmenge des euklidischen Raums. Der Log-Ratio Ansatz repräsentiert die Daten in Form von Koordinaten in der üblichen euklidischen Geometrie. Die bekannten Koordinaten sind die additive Log-Ratio (alr), die centered Log-Ratio (clr), und die isometric Log-Ratio Koordinaten (ilr). Die clr und ilr Koordinaten werden bevorzugt, da die ilr Darstellung orthonormale Koordinaten erstellt und die clr Darstellung eine Interpretation in Bezug auf die ursprünglichen Variablen ermöglicht. Diese Dissertation legt den Schwerpunkt auf die verschiedenen Aspekte der Kompositionsdaten: Ein Interessensgebiet sind die hoch-dimensionalen Kompositionsdaten, wobei die Interpretation der extrahierten Koordinaten eine komplexe Aufgabe sein kann. Ein weiteres Anliegen ist die Ausbreitung von Messfehlern bei der Darstellung der Kompositionen in Form von orthonormalen Koordinaten. Anwendungen in der Geochemie sowie in der Epidemiologie, ein neues Feld für diese Art von Analyse, heben die Brauchbarkeit des Log-Ratio Ansatzes hervor.

Abstract (English)

Compositional data represent the relative information between variables that are parts of some whole. The relevant information is contained only in the ratios between the measured variables, and not in the absolute values. A common procedure how to analyze this relative information is to use the so-called log-ratio approach, proposed by John Aitchison in the 1980s. From a geometrical point of view, the compositions live in the simplex sample space, and the log-ratio approach enables a representation in terms of coordinates in the usual Euclidean geometry. The well known coordinates are the additive log-ratio (alr), the centered log-ratio, and the isometric log-ratio (ilr) coordinates. The clr and ilr coordinates are preferred, since the ilr representation constructs orthonormal coordinates and the clr representation allows for an interpretation in terms of the original variables. We focus on different aspects of compositional data: One field of interest are high-dimensional compositional data, where the interpretation of the resulting coordinates can become a complex task. Another concern is the propagation of measurement errors in the construction of the orthonormal coordinates. Applications in geochemistry, but also in epidemiology, which is a new field for this kind of analysis, underline the usefulness of this approach.

Stats
The PDF-Document has been downloaded 62 times.