Bibliographic Metadata

Title
Visualizing hierarchically structured categorical data / Matthias Buchetics
AuthorBuchetics, Matthias
CensorHauser, Helwig
Published2007
DescriptionVI, 119 Bl. : Ill., graph. Darst.
Institutional NoteWien, Techn. Univ., Mag.-Arb., 2008
Annotation
Zsfassung in dt. Sprache
LanguageEnglish
Document typeMaster Thesis
Keywords (DE)Visualisierung / Kategorische Daten / Hierarchien / Informationsvisualisierung / Visuelle Analyse
Keywords (EN)Visualization / Categorical Data / Hierarchies / Information Visualization / Visual Analysis
URNurn:nbn:at:at-ubtuw:1-18523 Persistent Identifier (URN)
Restriction-Information
 The work is publicly available
Files
Visualizing hierarchically structured categorical data [5.27 mb]
Links
Reference
Classification
Abstract (German)

Jeden Tag werden riesige Datenmengen produziert, was die Analyse dieser Daten sehr anspruchsvoll macht. Mit der Darstellung von grafischen Repräsentationen anstelle von Tausenden Zahlen, machen sich Visualisierungstechniken die Fähigkeiten des menschlichen Sehsystems bei der Unterstützung in dieser Aufgabe zu nutzen.

Der Bereich der Informationsvisualisierung beschäftigt sich hauptsächlich mit abstrakten Daten. Abstrake Daten haben normalerweise keine räumliche Struktur und benötigen daher zusätzliche Schritte, um die Daten auf den Bildschirm abzubilden.

Kategorische Daten zeichnen sich in der Regel durch eine limitierte Anzahl von möglichen Ausprägungen aus und haben nicht notwendigerweise eine Ordnung, räumlichen Zusammenhang oder Distanz. Zusätzlich sind kategorische Daten oft hierarchisch strukturiert.

Diese Merkmale machen die Visualisierung von kategorischen Variablen schwer und traditionelle Visualisierungstechniken reichen meist nicht aus, um sie sinnvoll darzustellen.

Im Folgenden werden aktuell verfügbare Techniken zur Visualisierung von kategorischen Daten vorgestellt.

Der wichtigste Beitrag dieser Arbeit ist allerdings die Präsentation von zwei neuen Visualierungstechniken für hierarchisch strukturierte, kategorische Daten. Die erste Technik, Parallel Hierarchies, stellt mehrere Hierarchien gleichzeitig mit Hilfe eines Parallelachsen-Layouts dar und verwendet die Häufigkeiten der einzelnen Kategorien, um ihre grafische Darstellung zu skalieren. Kategorien von benachbarten Hierarchien werden dabei grafisch verbunden und interessante Verbindungen mit aufgrund von statistischen Berechnungen hervorgehoben.

Da die meisten Datensätze aber weder ausschließlich numerisch, noch ausschließlich kategorisch sind, beschreibt der zweite Ansatz eine neuartige Technik, dem Hierarchical Scatterplot, um eine kategorische Hierarchie in Bezug auf zwei numerische Dimensionen darzustellen. Auch hier unterstützt Statistik die Aufgabe.

Beide Techniken sind für eine interaktive Analyse der Daten ausgelegt und wurden in ein bestehendes Visualisierungssystem integriert.

Abstract (English)

Huge amounts of data are generated and collected every day and usually need to be analyzed in order to extract useful information.

However, the analysis of large amounts of data can be very challenging.

By using graphical representations, visual analysis techniques use the capabilities of the human visual system to assist in this task.

Unlike the data used in Scientific Visualization, the field of Information Visualization deals with displaying abstract data, which has usually no spatial structure, thus requiring additional steps in order to map the data to the 2D computer display.

This work focuses on a special type of data, namely categorical (qualitative) data. Categorical data dimensions typically have only a limited number of distinct values. The categories may lack any inherent ordering and meaningful ways to compute distances.

Additionally, categorical data is often hierarchically structured. These characteristics make the visualization of categorical data variables challenging. Traditional (item-based) visualization techniques are usually not ideal for presenting categorical.

Besides surveying available categorical data visualization techniques, the main contribution of this work are two new approaches for the visualization of hierarchically structured, categorical data. The first technique, Parallel Hierarchies, visualizes multiple hierarchies simultaneously, using a parallel axes layout and using the frequency of each category to scale its respective visual representation. Categories of adjacent hierarchies are connected and statistics are used to emphasize relationships between categories.

The second presented visualization, the Hierarchical Scatterplot, is a novel approach to visualize a categorical hierarchy in respect to two numerical dimensions. Again, statistics are used to support this task.

Both approaches allow for an interactive data analysis and are integrated in an existing visual analysis framework.