Kehrer, J. (2007). Integrating interactive visual analysis of large time series data into the SimVis system [Master Thesis, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-16413
time series data; interactive visualization of large data sets; interactive visual analysis; SimVis; similarity-based querying; interactive features specification; smooth brushing
en
Abstract:
Riesige Mengen an zeitabhängigen Daten entstehen in den unterschiedlichsten Bereichen von Wirtschaft, Wissenschaft und Technik (z.B. meteorologische Daten, Klimadaten, Aktienkurse, Daten aus der Meinungsforschung oder Medizin). Die entsprechenden Datensätze enthalten so genannten Zeitreihen und resultieren aus der Messung, der Simulation oder der Modellierung von dynamischen Prozessen. Oft sind mehrere Attribute (Dimensionen) enthalten, welche sich über die Zeit verändern.<br />In dieser Arbeit wird der CurveView vorgestellt, eine Möglichkeit zur interaktiven visuellen Analyse von multidimensionalen und großen Datensätzen mit Zeitreihen. Ein spezieller Ansatz zur interaktiven Datenvisualisierung wird vorgestellt, außerdem so genannte Brushing-Techniken, welche es dem/der BenutzerIn erlauben, interessante Merkmale (features) direkt am Bildschirm zu selektieren (z.B. mit der Maus). AnalytikerInnen wird es damit erleichtert, Einblicke in ihre Datensätze zu erlangen, um neue Hypothesen aufstellen zu können oder bestehende zu verifizieren. Strukturen innerhalb der zeitlichen Entwicklung von unterschiedlichen Datenattributen können visuell erkannt werden, ebenso können unbekannte Merkmale entdeckt werden. Der vorgestellte Ansatz ist in das bestehende SimVis System integriert, eine Anwendung zur visuellen Analyse von zeitabhängigen Simulationsdaten, wobei unterschiedliche Darstellungsarten (engl. views) zur Verfügen stehen, die untereinander verlinkt sind.<br />Die Zeitreihen werden mittels Fokus+Kontext Visualisierung dargestellt, wobei interessante und wichtige Datenmengen (Fokus) visuell hervorgehoben sind, wohingegen der Rest (Kontext) in abgeschwächter Form dargestellt wird. Diese Vorgehensweise erleichtert es dem/der BenutzerIn durch die Darstellung zu navigieren, ohne dabei die Orientierung zu verlieren. Durch die Verwendung von Transferfunktionen können z.B.<br />generelle Datentrends sowie Strukturen und Muster in dichten Bildschirmbereichen verstärkt werden. Außerdem können Sonderfälle hervorgehoben werden -- das sind z.B. einzelne Zeitreihen in Bereichen der Visualisierung die nur wenige Daten darstellen oder selektierte Merkmale, die in Regionen mit unselektierten Daten verborgen sind. Durch die Verwendung von speziellen Binning-Techniken wird die Datenmengen reduziert, wobei die Bedeutung (Charakteristik) erhalten bleibt. Das erleichtert die interaktive Darstellung der Information.<br />Selektionstechniken erlauben die interaktive Analyse der dargestellten Information. So können komplexe zeitabhängige Merkmale klassifiziert werden, wobei so genannte fuzzy sets verwendet werden. Im CurveView stehen Brushes zur Verfügung, die Zeitreihen aufgrund ihrer Ähnlichkeit zu einem festgelegten Muster klassifizieren -- dieses kann vom Benutzer direkt am Bildschirm als Linienzug gezeichnet werden. Außerdem gibt es so genannte Time Step Brushes mit denen Zeitreihen selektiert werden, die durch eine bestimmtes Intervall an einem Zeitschritt laufen. In SimVis können dann die Beziehungen zwischen unterschiedlichen Datenattributen (Dimensionen) -- und den dort spezifizierten Merkmalen - in unterschiedlichen verlinkten Views analysiert werden.<br />
de
Massive amounts of complex time-dependent information arise in various areas of business, science and engineering. These time series data sets commonly result from the measurement, modeling or the simulation of dynamic processes and contain multiple attributes changing over time. Examples are meteorological data, climate data, financial data, census data, or medical data, to name a few.<br />In this thesis the CurveView for the enhanced interactive visual analysis of multidimensional and large time series data is presented.<br />Two approaches are proposed, one for the interactive visual representation of the data, and so-called brushing techniques allowing the user to select certain interesting subsets of the data (features) in an intuitive and interactive way. The goals are to enable analysts to gain insight into their data sets, to create, verify or reject hypotheses based on the data, and to explore the temporal evolution of different attributes in order to detect expected structures and to discover unexpected features. The presented solution is integrated into SimVis, a multiple-views system for the visual analysis of time-dependent simulation results.<br />The data is visualized using focus+context visualization techniques:<br />important or selected portions of the data (focus) are visually accented, while the rest of the data (context) is shown in a less prominent style. In doing so, enhanced navigation and orientation is provided to the user. By the application of customizable transfer functions, general data trends, visual structures and patterns can be emphasized even within dense regions of the visualization. On the other hand, so-called outliers, which denote time series in low populated areas of the display or important (i.e., brushed) data items hidden in regions of context information, are discriminable in the visualization.<br />By the application of binning techniques large amounts of time-dependent information are transformed into a reduced but still meaningful representation which can be depicted at interactive frame rates.<br />Furthermore, interactive smooth brushing techniques are provided to the user for analysis purposes. Thus, complex time-dependent features can be specified by applying fuzzy classification to the time series data. Two kinds of brushes exist in the CurveView: similarity-based brushes where time series are classified according to their similarity to a user-defined pattern directly sketched in the view; and time step brushes, which select time series running through a certain area of the view. In SimVis, the interrelations between the specified features in multiple time-dependent dimensions can be analyzed visually using multiple linked views that show different attributes (i.e., dimensions) of the data.