<div class="csl-bib-body">
<div class="csl-entry">Dönz, B. (2014). <i>External semantic annotation of web databases : deep web semantic information integration and querying by mediator-based forwarding</i> [Dissertation, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2014.25289</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2014.25289
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/6265
-
dc.description
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers
-
dc.description
Zsfassung in dt. Sprache
-
dc.description.abstract
Inhalte aus Internet-Datenbanken sind für herkömmliche Suchmaschinen nicht vollständig erreichbar und nutzbar, stellen aber mit einem Verhältnis von etwa 500:1 als "Deep Web" den weitaus größten Teil der Informationen im Internet dar. Andererseits gibt es für das Semantische Web abseits wissenschaftlicher Projekte nur wenige Inhalte obwohl entsprechende Standards für viele Bereiche existieren. Im Zuge dieser Arbeit wird die Hypothese untersucht, dass existierende Informationssysteme, die für menschliche Benutzer entwickelt wurden, mit Hilfe von externen semantischen Annotationen von Programmen interpretiert werden und mit einem auf Mediatoren basierten Ansatz auch für das Semantische Web und damit für Suchanfragen und Datenintegration zugänglich gemacht werden können. Als Basis dafür wird ein Modell für Internet-Datenbanken definiert und in zwei Domänen evaluiert: Immobilien und Gebrauchtwagen. Von diesem Modell wird anschließend der Prozess abgeleitet, der das Weiterleiten von Abfragen und Extrahieren von Ergebnissen aus modellkonformen Datenbanken erlaubt. Mit Hilfe von externen semantischen Annotationen kann der auf diesem Konzept aufbauende und im Zuge dieser Arbeit entwickelte Prototyp "Deep Web Mediator" SPARQL Abfragen (die Standardabfragesprache des Semantischen Web) transparent an Internet-Datenbanken mit herkömmlichen, für menschliche Benutzer vorgesehene Schnittstellen, weiterleiten und die Ergebnisse an den Aufrufer zurückzugeben, wie es auch native semantische Datenbanken tun. Mit Hilfe dieses Prototyps wird gezeigt, dass das Nutzen von existierenden Informationssystemen im Umfeld des Semantischen Web möglich ist und die so gewonnenen Informationen auch mit anderen Quellen und lokalen Daten verknüpft werden können.
de
dc.description.abstract
The Deep Web offers approximately 500 times more information than the conventional World Wide Web, but is "hidden" behind Web forms that require some form of interaction. This makes it difficult for search engines to index the content. On the other hand, the Semantic Web is suffering from a lack of content: even if all necessary standards have been defined, only academic projects and a few early adopters have published data for the Semantic Web. This thesis investigates the use of external semantic annotations for making existing Web databases that are intended for human users accessible for programs. Using a mediator-based approach, queries can be transparently forwarded to several such sites making their content accessible for the Semantic Web. For this purpose, a model for Web databases is defined and validated in two domains: used cars and real estate. Based on this model an extraction process is derived that allows forwarding queries and extracting results from compatible systems. Using external semantic annotations that link elements of an actual website to the model, the "Deep Web Mediator" prototype developed in the course of this thesis can transform and forward SPARQL queries (the standard query language of the Semantic Web) to these sites and return information from Web databases in the same way onventional SPARQL endpoints do. A series of use cases demonstrates that this approach allows accessing the content of existing Web databases and also integrating this information with native semantic and local sources.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
Semantische Technologien
de
dc.subject
Informationsextraktion
de
dc.subject
Mediator Basierter Datenzugriff
de
dc.subject
Datenintegration
de
dc.subject
Verteilte Abfragen
de
dc.subject
Deep Web
de
dc.subject
Semantic Technologies
en
dc.subject
Information Extraction
en
dc.subject
Mediated Data Access
en
dc.subject
Data Integration
en
dc.subject
Distributed Querying
en
dc.subject
Deep Web
en
dc.title
External semantic annotation of web databases : deep web semantic information integration and querying by mediator-based forwarding
en
dc.title.alternative
Externe semantische Annotationen: Bearbeitung von Abfragen unter Verwendung eines Mediators zur Weiterleitung und Integration von Informationen aus existierenden Web Datenbanken
de
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.identifier.doi
10.34726/hss.2014.25289
-
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Benjamin Dönz
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
dc.contributor.assistant
Boley, Harold
-
dc.contributor.assistant
Bruckner, Dietmar
-
tuw.publication.orgunit
E384 - Institut für Computertechnik
-
dc.type.qualificationlevel
Doctoral
-
dc.identifier.libraryid
AC12156745
-
dc.description.numberOfPages
150
-
dc.identifier.urn
urn:nbn:at:at-ubtuw:1-62476
-
dc.thesistype
Dissertation
de
dc.thesistype
Dissertation
en
dc.rights.identifier
In Copyright
en
dc.rights.identifier
Urheberrechtsschutz
de
tuw.advisor.staffStatus
staff
-
tuw.assistant.staffStatus
external
-
tuw.assistant.staffStatus
staff
-
item.openaccessfulltext
Open Access
-
item.grantfulltext
open
-
item.cerifentitytype
Publications
-
item.mimetype
application/pdf
-
item.openairecristype
http://purl.org/coar/resource_type/c_db06
-
item.languageiso639-1
en
-
item.openairetype
doctoral thesis
-
item.fulltext
with Fulltext
-
crisitem.author.dept
E384 - Institut für Computertechnik
-
crisitem.author.parentorg
E350 - Fakultät für Elektrotechnik und Informationstechnik