Titelaufnahme

Titel
Web data extraction of university staff competencies / von Edin Zildzo
VerfasserZildzo, Edin
Begutachter / BegutachterinDorn, Jürgen
ErschienenWien, 2015
Umfangxiii, 76 Seiten : Illustrationen, Diagramme
HochschulschriftTechnische Universität Wien, Diplomarbeit, 2015
Anmerkung
Zusammenfassung in deutscher Sprache
SpracheEnglisch
DokumenttypDiplomarbeit
Schlagwörter (EN)Competency / Web data extraction
URNurn:nbn:at:at-ubtuw:1-82909 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Web data extraction of university staff competencies [2.87 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Diese Arbeit präsentiert einen Ansatz um Daten von Mitarbeitern einer Universität und ihre berufliche Kompetenzen zu extrahieren, während man sich mit Themen wie Web-Datenextraktion Probleme wie z.B. Seitenstruktur Probleme, Dynamic Data, Unstrukturierte Daten usw. auseinandersetzen muss. Die Software die in dieser Arbeit vorgeschlagen versucht Daten zu extrahieren von Universitätsmitarbeitern und ihre berufliche Kompetenzen und das soweit möglich von den meisten Universitäten. Die Professionellen Kompetenzen der Universitätsmitarbeiter werden durch die Verwendung einer bestehenden Ontologie ermittelt, die erweitert wird um die Domäne eines Anwendungsfalls abzudecken. Diese Software wird aus zwei Teilen zusammengesetzt sein. Der erste Teil wird sich damit beschäftigen um alle nötigen Daten zu besorgen die ein Input für den zweiten Teil sein wird, welches ein Datenextrahieren ist. Es wird den SelectorGadget Bookmarklet verwenden, welches die CSS-selector Elemente bereitstellt mit denen Benutzer auswählen können welche Daten sie für die Extraktion möchten. Das andere Bookmarklet wird den Input von SelectorGadget bekommen und es dann an das Data extraction Software weiterleiten. Um das vorgeschlagene Verfahren zur Extraktion von den oben angeführten Daten zu evaluieren wird eine Umfrage durchgeführt mit Mitarbeitern eines Anwendungsfalls. Die Genauigkeit der extrahierten Kompetenzen die durch diese Arbeit ermittelt wurden wird durch den Vergleich mit Kompetenzen die aus der Umfrage gewonnen wurden gemessen.

Zusammenfassung (Englisch)

This thesis presents an approach to extract University staff professional competences while dealing with Web data extraction issues like page structure problems, dynamic data, unstructured data, etc... The software which is proposed in this thesis will tend to extract University staff professional competences from most of the Universities and if it is possible to work for all. University staff professional competences will be determined by using an existing ontology which will be extended to cover the domain of an use case. That software will be composed of two parts. First part will be dealing with gathering required data which will be an input for the second part which will be a data extractor. It will use SelectorGadget bookmarklet which provides CSS-selector elements with which users can select desired data for extraction. The other bookmarklet will get the input from SelectorGadget and pass it to data extraction software. In order to evaluate the proposed method for extracting University staff professional competences the survey will be conducted with staff members of an use case. The accuracy of extracted competences obtained by the method from this thesis will be measured by comparing them with competences obtained from the survey.