Deep learning in medical image analysis

Seeböck, Philipp

doi:10.34726/hss.2015.23137

Record link:

https://doi.org/10.34726/hss.2015.23137
http://hdl.handle.net/20.500.12708/5129

Title:

Citation:

Seeböck, P. (2015). Deep learning in medical image analysis [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2015.23137

reposiTUm DOI:

10.34726/hss.2015.23137

CatalogPlus:

AC12204632

Publication Type:

Thesis - Diplomarbeit

Language:

English

Authors:

Seeböck, Philipp

Advisor:

Sablatnig, Robert

Co-advisor:

Langs, Georg

Organisational Unit:

E183 - Institut für Rechnergestützte Automation

Date (published):

2015

Number of Pages:

145

Keywords:

Machine Learning; Deep Learning; Medical Image Processing

Abstract:

Machine Learning wird im Bereich der medizinischen Bildverarbeitung eingesetzt, wobei unter anderem Computergestützte Diagnose, Segmentierung und bildgestützte Therapie Aufgabenbereiche sind. Deep Learning Methoden sind spezielle Machine Learning Ansätze, welche versuchen automatisch mehrere Ebenen der Abstraktion zu lernen, um Daten interpretieren und verstehen zu können. Dies führt zu der Notwendigkeit die Charakteristiken der Deep Learning Methoden zu untersuchen, um in der Lage zu sein diese Methoden richtig anwenden zu können. Das Ziel dieser Arbeit ist deshalb Deep Learning Methoden in einem medizinischen Kontext zu evaluieren und herauszufinden, welche Vorteile Deep Learning Methoden (random recursive support vector machines, stacked sparse auto-encoders, stacked denoising auto-encoders, K-means deep learning algorithm) im Vergleich mit state of the art Ansätzen (K-nearest neighbor, support vector machines, extremely randomized trees) bringen. Dafür werden die Methoden auf zwei Klassifikationsaufgaben evaluiert. Neben einer Evaluierung in Bezug auf Vorhersagegenauigkeit und Laufzeit, enthält diese Arbeit auch eine qualitative Analyse der gelernten Eigenschaften der Deep Learning Ansätze und praktische Empfehlungen. Die Ergebnisse deuten darauf hin, dass stacked sparse auto-encoders, stacked denoising auto-encoders und support vector machines die höchste Vorhersagegenauigkeit auf beiden Datensätzen erreichen. Das bedeutet, dass diese Methoden zu bevorzugen sind, falls die vorhandenen Rechnerressourcen dies erlauben. Im Gegensatz dazu weisen die random recursive support vector machines die kürzeste Trainingsdauer auf beiden Datensätzen auf, erreichen allerdings eine niedrigere Vorhersagegenauigkeit im Vergleich mit den vorher genannten Methoden. Das impliziert, dass die random recursive support vector machines verwendet werden sollten, falls die Rechnerressourcen stark begrenzt sind und die Laufzeit ein wichtiger Faktor bei der Auswahl der Methode ist.

Machine learning is used in the medical imaging field, including computer-aided diagnosis, image segmentation, image registration, image fusion, image-guided therapy, image annotation, and image database retrieval. Deep learning methods are a set of algorithms in machine learning, which try to automatically learn multiple levels of representation and abstraction that help make sense of data. This in turn leads to the necessity of understanding and examining the characteristics of deep learning approaches, in order to be able to apply and refine the methods in a proper way. The aim of this work is to evaluate deep learning methods in the medical domain and to understand if deep learning methods (random recursive support vector machines, stacked sparse auto-encoders, stacked denoising auto-encoders, K-means deep learning algorithm) outperform other state of the art approaches (K-nearest neighbor, support vector machines, extremely randomized trees) on two classification tasks, where the methods are evaluated on a handwritten digit (MNIST) and on a medical (PULMO) dataset. Beside an evaluation in terms of accuracy and runtime, a qualitative analysis of the learned features and practical recommendations for the evaluated methods are provided within this work. This should help improve the application and refinement of the evaluated methods in future. Results indicate that the stacked sparse auto-encoder, the stacked denoising auto-encoder and the support vector machine achieve the highest accuracy among all evaluated approaches on both datasets. These methods are preferable, if the available computational resources allow to use them. In contrast, the random recursive support vector machines exhibit the shortest training time on both datasets, but achieve a poorer accuracy than the afore mentioned approaches. This implies that if the computational resources are limited and the runtime is an important issue, the random recursive support vector machines should be used.

Additional information:

Zsfassung in dt. Sprache

License:

In Copyright

Appears in Collections:

Thesis