<div class="csl-bib-body">
<div class="csl-entry">Hager, G. (2016). <i>Improving verifyability and repeatability for data-driven workflows</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2016.30641</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2016.30641
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/2338
-
dc.description
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers
-
dc.description
Zusammenfassung in deutscher Sprache
-
dc.description.abstract
Das Verwenden von Workflow Systeme für Machine Learning ermöglicht es Daten skalierbar und effizient zu verarbeiten, um daraus Modelle herzustellen, die für datengetriebene Entscheidungen und Vorhersagen verwendet werden können. Diese Masterarbeit untersucht Konzepte für die Verbesserung der Verifikation und Wiederholbarkeit von Workflows. Die behandelten Themen sind Data Provenance und Dynamic Data Citation. Es wird untersucht wie Provenance Information während der Ausführung eines Workflow gesammelt und dargestellt werden kann. Des Weiteren wird analysiert wie das Zitieren von dynamischen Daten mit Hilfe von Workflows umgesetzt werden kann. Um die Durchführbarkeit der ausgearbeiteten Konzepte zu zeigen, wurden eine praktische Implementierung in einer cloud-basierten Machine Learning Umgebung durchgeführt. Die fertige Implementierung wurde möglichst generisch konstruiert damit man die Vorgehensweise auch auf andere Workflow Management Systeme anwenden kann. Zusätzlich wurden Empfehlungen für Machine Learning Applikationen erstellt, um die behandelten Themen besser unterstützen zu können. Der Einsatz der ausgearbeiteten Konzepte und Empfehlungen dieser Masterarbeit verbessern die Verifizierbarkeit und Wiederholbarkeit von Workflows.
de
dc.description.abstract
Using Workflow Systems for Machine Learning provides a scalable and efficient way to process data to create models which can be used for data-driven decisions and predictions. This thesis examines concepts for improving the verification and repeatability of such workflows. The covered topics include Data Provenance and Dynamic Data Citation. It investigates how provenance information can be collected during workflow execution and properly represented with a model. Furthermore it is analyzed how the citation of dynamic data can be realized in form of a workflow. To show the feasibility of the elaborated concepts some practical implementations are created in a high-performance, cloud-based machine learning environment. The final implementation is generically designed so the construction approach can be used for other workflow management systems. In addition recommendations for machine learning applications for supporting the discussed topics are proposed. The created concepts and recommendations can be used for improving the verifiability and repeatability of workflows.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
Workflow Management Systeme
de
dc.subject
Machine Learning
de
dc.subject
Verifikation
de
dc.subject
Verifizierbarkeit
de
dc.subject
Wiederholbarkeit
de
dc.subject
Dynamic Data Citation
de
dc.subject
Data Citation
de
dc.subject
Data Provenance
de
dc.subject
Datenherkunft
de
dc.subject
Cloud-basiert
de
dc.subject
Workflow Management Systems
en
dc.subject
Machine Learning
en
dc.subject
Verification
en
dc.subject
Verifiability
en
dc.subject
Repeatability
en
dc.subject
Dynamic Data Citation
en
dc.subject
Data Provenance
en
dc.subject
Cloud-based
en
dc.title
Improving verifyability and repeatability for data-driven workflows
en
dc.title.alternative
Verbesserung der Wiederholbarkeit und Nachvollziehbarkeit datengetriebener Prozesse
de
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.identifier.doi
10.34726/hss.2016.30641
-
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Gerhard Hager
-
dc.publisher.place
Wien
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
tuw.publication.orgunit
E188 - Institut für Softwaretechnik und Interaktive Systeme