Titelaufnahme

Titel
Web accessibility for the blind through visual representation analysis / von Ruslan Fayzrakhmanov
VerfasserFayzrakhmanov, Ruslan
Begutachter / BegutachterinPichler, Reinhard
Erschienen2013
UmfangXII, 283 S. : Ill., graph. Darst.
HochschulschriftWien, Techn. Univ., Diss., 2014
Anmerkung
Zsfassung in dt. Sprache
SpracheEnglisch
Bibl. ReferenzOeBB
DokumenttypDissertation
Schlagwörter (GND)Blindheit / World Wide Web / Zugang / Web-Seite / Visualisierung / Analyse / Modellierung
URNurn:nbn:at:at-ubtuw:1-67146 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Web accessibility for the blind through visual representation analysis [7.7 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Chancengleichheit bei selbständiger Entwicklung und Aktualisierung für alle ist ein wichtiges Merkmal zivilisierter Gesellschaften. In der heutigen Informationsgesellschaft findet dieser Aspekt eine seiner Umsetzungen in der Verbesserung des Zugangs verschiedener Bevölkerungsgruppen zu Informationsressourcen. Information ist ein unabdingbarer Teil des heutigen Lebens. Diese Tatsache verdeutlicht die laufende Entwicklung und Expansion des World Wide Web (des Internets) - einer riesigen Informationsplattform, die für Menschen große Chancen eröffnet hat, indem sie die effiziente Lösung von Aufgaben im Geschäftsleben, in der Bildung, der Wissenschaft und in unserem täglichen Leben ermöglicht. Mit Hilfe des Internets kann man Rechnungen bezahlen, Produkte und Dienstleistungen kaufen, an einer Fernuniversität studieren, nach Artikeln suchen und sie lesen, Kontakt mit FreundInnen halten und vieles mehr. Diese Möglichkeiten stehen jedoch nicht allen offen. Zum Beispiel sind blinde Menschen beim Surfen im Internet mit vielen Problemen konfrontiert. Dies liegt an der Orientierung der überwiegenden Mehrheit von Webseiten an sehenden BenutzerInnen, ohne Berücksichtigung von blinden BenutzerInnen. Blinde BenutzerInnen nehmen die Welt anders wahr und benötigen daher effiziente Mechanismen zur Navigation durch die Elemente einer Webseite und zum Verstehen von deren semantischer Rolle, um in kurzer Zeit einen Überblick über eine Seite zu bekommen und diese durchsuchen zu können. Aktuelle Zugänge bieten eingeschränkte Lösungen, die bestimmte Ziele verfolgen, seien diese die Segmentierung von Webseiten oder Textzusammenfassungen etc. Zudem muss erwähnt werden, dass die meisten Zugänge sich auf nichtvisuelle Webseitendarstellungen wie den Quellcode (X/HTML und XML) und Baumdarstellungen (Tag-Baum oder DOM-Knotenbaum) beziehen, die nicht die Semantik wiederspiegeln, die von sehenden BenutzerInnen analysiert und ausschließlich auf der dargestellten Webseite abgebildet wird. Diese Tatsache erklärt die begrenzten Möglichkeiten derartiger Methoden. Das Ziel dieser Dissertation ist es, die Zugänglichkeit von Webseiten für blinde BenutzerInnen zu verbessern. Um dieses Ziel zu erreichen, schlagen wir eine komplexe Lösung vor, die alle Probleme des automatischen Verstehens der funktionalen Elemente einer Webseite auf den dargestellten Webseiten und ihrer Navigation abdeckt. Zunächst stellen wir Mittel zur Analyse und zum Verstehen einer Webseite auf der visuellen Ebene zur Verfügung, die die Hauptinformation transportieren, die nicht nur durch den Textinhalt, sondern auch durch Layout, Stile und andere Eigenschaften, die von sehenden BenutzerInnen wahrgenommen werden können, vermittelt wird. Zweitens werden die Probleme bei der Verbesserung der Internetmobilität von blinden BenutzerInnen auf der Basis der erkannten logischen Elemente einer Webseite im Detail untersucht und Lösungen vorgeschlagen. Angesichts der Komplexität der Analyse der visuellen Eigenschaften liegt ein Hauptaugenmerk dieser Dissertation auf der Modellierung der visuellen Merkmale einer Webseite nach dem Unified Ontological Model (UOM) und der Entwicklung von Methoden und Techniken zum Abfragen des Modells und von Zugängen zur Realisierung von Methoden für das Verstehen von Webseiten und der darauf basierenden Extraktion von Informationen. Die Einzigartigkeit des UOM besteht in der Integration verschiedener Aspekte einer Webseite, wie etwa der Geometrie des Layouts mit quantitativen und qualitativen Eigenschaften, Schnittstellen mit verschiedenen funktionellen Elementen und Strukturen und dem DOM-Knotenbaum in einem konsistenten Modell. Der vorgeschlagene plattformübergreifende Rahmen, Web Page Processing System (WPPS), sichert eine effiziente Generierung des UOM laut der spezifizierten Konfiguration und stellt dem Programmierer eine Schnittstelle zur Anwendungsprogrammierung (Application Programming Interface - API) zur Entwicklung von Methoden und Algorithmen der Webseitenverarbeitung zur Verfügung. Das WPPS hat seine Effizienz bei der Entwicklung von Methoden zur Webseitensegmentierung, Webobjektidentifikation und Informationsextraktion bewiesen. Zur Verbesserung des Internetzugangs auf der Basis von identifizierbaren Webseitenelementen schlägt diese Dissertation das multiaxiale Navigationsmodell (MANM) und die multiaxiale Navigationsmethode vor. Ein plattformübergreifendes System, Blindzilla, das seine Effizienz in der Evaluation mit blinden BenutzerInnen gezeigt hat, setzt diese Konzepte um.

Zusammenfassung (Englisch)

One of the most important attributes of a civilized society is based on the principle of equal opportunities for self-development and self-actualization within one's life. In today's contemporary information society, this principle can be realized by enhancing the accessibility of information resources for various groups of the population. Information is an inalienable part of today's life. This fact is clearly evident in the ongoing development and expansion of the World Wide Web (the Web) - a huge information platform that has provided vast opportunities for people by making it possible to effectively solve various tasks in business, education, science, and our everyday lives. With the help of the Web, a person can pay bills, buy products and services, complete university degrees online, search for and read articles, keep contact with their friends and so much more. However, these opportunities are not available for everybody. For example, people who are blind encounter a lot of problems surfing the Web. This is a direct result of the majority of web pages being orientated at sighted users and not taking into account users who are blind. Blind users perceive the world differently and therefore need effective mechanisms for navigation through the elements on a web page and the thorough understanding of their semantic role in order to obtain an overview of a page in a few moments and perform a search. Current approaches provide us with limited solutions in the pursuit of particular goals such as web page segmentation or text summarization. Moreover, most approaches consider non-visual web page representations, such as source code (X/HTML and XML) and tree representations (the tag tree and DOM tree) which do not reflect the semantics that is analyzed by sighted users and posed exclusively on the rendered web page. This fact explains the limitations of such methods. The goal of this thesis is to enhance the accessibility of web pages for blind users. In order to achieve this goal, we propose a complex solution covering the problems of automatic understanding of a web page's functional elements on the rendered web pages and navigation. Firstly, we provide the means for web page analysis and understanding on the visual level which carries the main information presented not only by the textual content, but also by the layout, styles and other visual characteristics perceivable by sighted users. Secondly, the challenges in improving web mobility of blind users based on the recognized logical elements of a web page are considered in detail and solutions are proposed. Considering the complexity in the analysis of visual characteristics, close attention is payed to the modeling of a web page-s visual features defined in the Unified ntological Model (UOM) as well as developing methods and techniques for querying the model and aproaches for realizing methods for web page understanding and information extraction. The uniqueness of the Unified Ontological Model (UOM) is based on its integration of different aspects of a web page in one consistent model, such as geometry of the layout with quantitative and qualitative characteristics, interface with different functional elements and structures, and the DOM tree. The proposed cross-platform framework, Web Page Processing System (WPPS), ensures an efficient generation of the UOM according to the provided configuration and conveys an application programming interface (API) for developing methods and algorithms of web page processing. The WPPS demonstrated its effectiveness in developing methods of web page segmentation, web object identification and information extraction. For enhancing web accessibility based on the identified web page elements, the Multi-Axial Navigation Model (MANM) and navigation methodology are proposed in this thesis. Blindzilla, a cross-platform system which demonstrated its effectiveness in an evaluation with blind users, implements these concepts.