Titelaufnahme

Titel
Semantic web information retrieval : a semantic web based virtual query system for supporting user query formulation and information retrieval in the semanticLIFE personal digital memory framework / von Huu Hanh Hoang
VerfasserHoang, Huu Hanh
Begutachter / BegutachterinTjoa , A Min
Erschienen2007
UmfangXIII, 118 Bl.
HochschulschriftWien, Techn. Univ., Diss., 2007
SpracheEnglisch
Bibl. ReferenzOeBB
DokumenttypDissertation
Schlagwörter (DE)semantic web information retrieval, user query formulation
Schlagwörter (GND)Semantic Web / Information Retrieval
URNurn:nbn:at:at-ubtuw:1-18687 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Semantic web information retrieval [1.25 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Im Jahre 1945, erfand Vannevar Bush die Idee von Memex, einer "Vorrichtung, in der alle Bücher, Aufzeichnungen und Unterhaltungen einer Person gespeichert und mechanisiert werden, damit man mit sehr hoher Geschwindigkeit und Flexibilität beraten werden kann. Diese Vorrichtung ist eine vergrößerte und vertrauliche Ergänzung zum Gedächtnis".

Das SemanticLIFE Projekt ist ein Versuch, an Vannevar Bush's Anblick einen Schritt näher zu kommen. Bis zuletzt können wir eine rasante Verbreitung neuer Projekte beobachten, die einige der Ziele Bush's erfinderischen Ideen anstreben. Diese Verbreitung wird hauptsächlich durch die schnell wachsende Vorantreibung der technologischen Entwicklung verursacht, die neue Potentiale für die Realisierung öffnet.

Ein Indikator für die Reduktion der Diskrepanz zwischen den Visionen von Memex und deren Realisierung ist die Ansage vom britischen Computing Research Committee (http://www.ukcrc.org.uk/) als eine der sieben größten Herausforderungen fürs Computing Research "Gedächtnisse fürs Leben - Mit Informationen über die menschliche Lebenszeit hinaus zurechtzukommen". Das ACM Seminar über sukkzessives Archivieren und Wiederherstellen von persönlichen Erfahrungen (http://research.microsoft.com/CARPE2004/) ist ein anderes Indiz dafür, daß die Zeit um solche Systeme einzuführen reif ist. In Richtung dieser Ziele, persönliche Informationen des gesamten Leben einer Person abzuspeichern und wiederherzustellen, ziehen Forscher auch andauernde Speicherung und Abrufung aller Daten von persönlichen Erlebnissen, unter anderem auch E-Mails, Kontaktinformationen, Treffen, besuchte Webseiten, Dokumente, Logdaten von Instant-Messaging Programmen, Telefongesprächen usw. in Betracht.

Die herausfordernde Aufgaben sind, wie man nützliches Wissen von dieser mit Informationen überfüllter Bibliothek extrahiert; und wie man dieses Wissen effektiv verwendet. Das virtuelle Abfrage System (Virtual Query System) der SemanticLIFE, das in dieser Dissertation vollständig dargestellt wird, ist eine Annäherung an die erwähnten Aufgaben und stellt in einer erfinderischen Art und Weise die benutzerorientierte Abfrage-Formulierung, ein sogenanntes "front-end" zur Verfügung. Mit Unterstützung des virtuellen Frage Systems, wird dem SemanticLIFE-Benutzer bei der Ausgabe von eindeutigen Fragen geholfen, um die reichen semantischen Informationen von seinen historischen persönlichen Daten wiederherzustellen.

Bei der Entwicklung von ähnlichen SIM Systemen wird der Fokus sehr oft auf back-end gesetzt, wie zum Beispiel auf die Erfassung von allen Datenquellen, Integration und Speicherung deren in großen Datendepots.

Zu diesem Zweck ist es notwendig, die Ontologies der verschiedenen Datenquellen in ein allgemeines Ontology des Systems abzubilden. Jedoch werden Benützer innerhalb des Systems hinsichtlich der gespeicherten Informationen mit mangelndem Wissen konfrontiert und würden vieldeutige Anfragen formulieren, so müssten viele Hindernisse überwunden werden, bevor das System die verlangten Resultate liefern kann.

Meine Dissertation strebt ein Design von innovativen Eigenschaften unseres virtuellen Abfrage-Systems an. Dieses Abfragesystem basiert auf eine Front-End Annäherung, die dem User erlaubt, angestrebte Informationen von sehr großen Datendepots (repository) in einer effizienten Art und Weise zu extrahieren. Die Konzeption dieses Abfrage-Systems, das grundsätzlich auf Reduktion von semantischen Mehrdeutigkeiten von Benützerabfragenspezifikationen im sehr frühen Stadium des Informationsextraktionsprozesses basiert und den User durch die Verwendung von einem Satz von Abfrage-Schablonen im Abfrageprozess führt, die sowohl auf Benutzers Abfragen basieren wie auch auf virtuelle Informationen, heisst "Context Ontology".

Diese Annäherung integriert viele Forschungsbemühungen aus den Bereichen der semantischen Netze, Abfrageoptimierung, Zwischenspeicherung von semantischen Abfragen für RDF, der Schlussfolgerung, des Ontology-Diagramms und der Benutzerinteraktion.

Zusammenfassung (Englisch)

Back in 1945, Vannevar Bush coined the idea of Memex as "a device in which an individual stores all his books, records, and communications, and which is mechanized so that it may be consulted with exceeding speed and flexibility. It is an enlarged intimate supplement to his memory" [Bus45]. The SemanticLIFE project is an attempt to come a step closer to Vannevar Bush's vision. Recently we can observe a mushrooming of new projects aiming at some of the goals of Bush's innovative ideas. This is mainly caused by the racy technological development which opens new realization potentials. An indicator for the narrowing of the discrepancy between the visions of Memex versus its realization is the announcement of "Memories for life - Managing information over a human lifetime" as one of the seven Grand Challenges for Computing Research [FR03] by the UK Computing Research Committee (http://www.ukcrc.org.uk/). The ACM Workshop on Continuous Archival and Retrieval of Personal Experiences (http://research.microsoft.com/CARPE2004/) is another indicator for the maturity of our present time to implement such systems.

Towards the goals of personal information storage and retrieval of all one's data throughout a lifetime, researchers consider continuous archival and retrieval of all media relating to personal experiences including emails, contacts, appointments, web browsing history, documents, IM logs, phone calls, etc. The challenging issues are how to extract useful knowledge from this rich library of information; and how to use this knowledge effectively. The SemanticLIFE's Virtual Query System, which is presented thorough this thesis, is an approach for mentioned issues and by providing an innovative way of user-oriented query formulation, so-called "front-end" approach, to the SemanticLIFE Personal Information Management (PIM) system. With support of the Virtual Query System, the SemanticLIFE user is supported in issuing unambiguous queries to retrieve the rich semantic information from his/her historical personal data.

Most often when developing similar PIM systems, researches focus on back-end issues, i.e. capturing all data sources, integrate and then store them in huge repositories. For this purpose it is necessary to map the ontologies of the various data sources into a common ontology of the system. However, users are confronted with the lack of knowledge concerning the stored information inside the system, and they would formulate ambiguous requests, so that many barriers have to be overcome before the system could deliver the demanded results.

My thesis is aiming at a design of the innovative features of our Virtual Query System. This query system is based on a front-end approach allowing the user to retrieve the information of interest from huge ontology-based repositories in an efficient way. The conception of this query system which is primarily based on the reduction of semantic ambiguities of user query specifications at the very early stage of the retrieving process; and continually guide the user in query process using a set of query templates based-on the user's querying context as well as the virtual information, say context ontology. This approach integrates many research efforts from the area of the Semantic Web, query refinement, semantic query caching for RDF data, inference, ontology mapping, and user interaction.