Bibliographic Metadata

Title
Analyse des Tagging-Verhaltens am Beispiel von Flickr: The Commons / von Amit Gahlay
Additional Titles
Analysis of the tagging behavior: on example of Flickr: The Commons
AuthorGahlay, Amit
CensorMerkl, Wolfdieter ; Arends, Max
Published2012
DescriptionXIII, 91 S. : Ill., graph. Darst.
Institutional NoteWien, Techn. Univ., Dipl.-Arb., 2012
Annotation
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers
Zsfassung in engl. Sprache
LanguageGerman
Document typeThesis (Diplom)
Keywords (DE)social tagging/flickr/the commons/gemeinschaftliches indexieren/social software
Keywords (EN)social tagging/flickr/the commons/communitiy indexing/social software
URNurn:nbn:at:at-ubtuw:1-46811 Persistent Identifier (URN)
Restriction-Information
 The work is publicly available
Files
Analyse des Tagging-Verhaltens am Beispiel von Flickr: The Commons [6.26 mb]
Links
Reference
Classification
Abstract (German)

Social Tagging-Dienste wie Flickr und Del.icio.us gehören, neben Diensten wie Facebook und YouTube, zu den Stars der Web 2.0-Ära. Sie ermöglichen ihren Benutzern, diverse Ressourcen, mit frei gewählten Schlagwörtern zu versehen. Das Social Tagging bietet eine sinnvolle, intuitive und qualitativ hochwertige Verschlagwortung, welche zu einer guten inhaltliche Beschreibung der Informationsobjekte und einer Verbesserung von Suchergebnissen führt, selbst wenn einzelne Tags unpassend oder sogar als kritisch einzustufen sind. Aufgrund der großen Anzahl an Nutzern entsteht ein mächtiges Kontrollsystem, welches falsche Informationen bzw. Missbrauch des Dienstes nahezu unmöglich macht.

Durch die Initiative von Flickr entstand 2009 das Projekt "The Commons" welches zwei Hauptziele verfolgt. Zum einen, möchte man einer breiten Masse die öffentlichen Fotoarchive dieser Welt zugänglich machen und zum anderen möchte man diese Sammlung durch deren Wissen bereichern.

Bei "Flickr: The Commons" ist vor allem die Assoziationsfähigkeit zwischen Tagger und dem Foto ausschlaggebend d.h. der User weist dem Foto nur dann ein Schlagwort hinzu wenn er sich in irgendeiner Form mit dem gezeigten Objekt identifiziert. Genau diese Assoziationsbeziehung zwischen dem Tagger und dem abgebildeten Objekt, wird im Rahmen dieser Arbeit näher untersucht werden.

Im ersten Teil setzt sich die Arbeit mit den theoretischen Grundlagen von Social Tagging auseinander. Der zweite Teil dient als Vorbereitung auf den praktischen Teil. In diesen Abschnitt werden die Daten sowie die verwendeten Tools näher erläutert. Im dritten praxisbezogenen Teil der Arbeit wird anhand von "Flickr: The Commons" die Assoziationsbeziehung zwischen Tagger und dem Objekt näher untersucht. Hier kommen neben bereits vorhandenen Tools, auch zwei eigenes entwickelte Anwendungen FlickrMaps und ClusterTags zum Einsatz. Bei FlickrMaps handelt es sich um ein Echtzeit-Mashup, welches Flickr und GoogleMaps verbindet.

Dahingegen arbeitet ClusterTags mit einer vorher erstellten Datenbasis und gruppiert Schlagwörter nach geografischen Merkmalen.

Beide Anwendungen werden in diesem Kapitel zur Analyse der geografischen Zusammenhänge zwischen Tagger und den Institutionen verwendet. Im Detail wurde, ClusterTags für die Berechnung des geografischen Einflusses aller Kulturinstitutionen verwendet. Bei vier Einrichtungen konnte ein globaler Einfluss nachgewiesen werden. Mithilfe der Applikation FlickrMaps, wurde der Zusammenhang zwischen Aufnahmeort des Bildes und Herkunft der Tagger untersucht. Hier konnte auch gezeigt werden, dass Bilder mit Angabe eines Aufnahmeortes in Summe viel mehr lokale Tags aufweisen als Bilder ohne Aufnahmeort.

Neben diesem Zusammenhang wurden auch die Institutionen, Bilder sowie Schlagwörter und Kommentare im Detail untersucht. Bei den Institutionen und Bildern wurde ein eigener Beliebtheitsindex angewendet um die Populärsten aus der Datenbasis zu berechnen. Dieser Index normiert die Anzahl der Tags, Kommentare, Tagger und Kommentatoren auf Basis der jeweili- gen Maximalwerte und ist dadurch robust gegenüber Powerusern.

Die Schlagwörter wurden mittels einer Häufigkeitsanalyse untersucht und abhängig von der An- zahl ihrer Zeichen in fünf Klassen eingeteilt. Bei diesen fünf Klassen wurde festgestellt, dass der Anteil der Tags welche von den Benutzern vergeben wurden, von Klasse zu Klasse immer höher wurde, bis schlussendlich 90% der Tags von den Benutzern stammen. Die restlichen Tags wurden von den Institutionen vergeben. Bei den Schlagwörtern, wurde auch ein Zusammenhang zwischen der Häufigkeit bestimmter Tags und deren Anzahl an Zeichen hergestellt und mit dem Zipfschen Gesetz erklärt.

Bei den Kommentaren wurde ebenfalls eine Häufigkeitsanalyse durchgeführt und die Anzahl der Zeichen analysiert. Weiters wurden Schlagwörter aus den Kommentaren extrahiert und mit den Schlagwörtern eines Bildes verglichen. Hier wurde eine Übereinstimmung von 10% nachge- wiesen, d.h.

die extrahierten Schlagwörter waren in 10% der Fälle auch in den vergebenen Tags der Bilder vorhanden. Außerdem konnte in diesem Kapitel gezeigt werden, dass Kommentare sehr häufig auf falsche Informationen hinweisen. Um dies festzustellen, wurden die Kommen- tare nach bestimmten Wörtern (false, wrong) abgesucht. Jedes vierte Kommentar enthielt einer dieser beiden Wörter.

Abschließend folgt eine Schlussfolgerung und ein Ausblick auf eine mögliche Verwendung der Ergebnisse.

Abstract (English)

Social Tagging services such as Flickr and Del.icio.us belong, in addition to services like Facebook and YouTube4to the stars of the Web 2.0 era. They allow users to tag different ressources with free chosen keywords. Social tagging offers an easy, intuitive and high quality way of indexing, which leads to a good description of the content and the improvement of search results, even when individual tags are classified wrong. Due to the large number of users, false information or abuse of the system is almost impossible.

Flickr created the project The Commons in 2009 which has two essential objectives. The first goal of The Commons is to show people hidden treasures in the world's public photography archives, and secondly to show how their input and knowledge can help make these collections even richer.

At "Flickr: The Commons" especially the association between the tagger and the photo is crucial. The user only tags the photo with a keyword if he can identify himself in any way with the shown object. Exactly this association relationship between the tagger and the tagged object plays a big part in this master thesis.

The first part of this thesis describes the theoretical foundations of social tagging including different tagging systems and basic knowledge of folksonomy. The second part gives a short prepartion for the practical part of this thesis by introducing "Flickr: The Commons" and different tools. Also the own developed tools FlickrMaps and ClusterTags are introduced in this part. FlickrMaps is a real-time mashup that combines Google Maps and Flickr. Whereas, ClusterTags works with a previously created database and groups keywords by geographical features.

In the last part of this thesis the data of The Commons is analyzed and the results are presented. Both applications FlickrMaps and ClusterTags, are used in this chapter to analyze the geographical relationships between the tagger and institutions. The application ClusterTags , is used to calculate the geographical influence of all cultural institutions. A globale influence was calculated for four institutions.

With the application FlickrMaps the relationship between the recording location of an image and the origin of the taggers were investigated. At this point, the investigation showed that images with an recording location have much more local tags then images without an recording location.

In addition the institutions, as well as pictures, keywords and comments are analyzed in greater details. To find popular institutions and pictures, a self definied popularity index is applied. This index normalizes the number of tags, comments, taggers and commentators based on their maximum values and is robust against power users.

The tags were examined using a frequency analysis and classified depending on the number of characters into five classes. It was shown, that the proportion of tags, which were assigned by the users, where increasing from class to class. In class 5 this value reached 90%, this means 90% of all tags were assigned by the users and only the remaining 10% were assigned by institutions. Also a correlation between the frequency of popular tags and their character-length was investigated and explained using the Zipf-Law. From the comments, keywords were extracted and compared to the tags of a picture. In this case a match of 10% was detected, this means that 10% of the extracted keywords from the comments could also be found in the tags assigned to the image. It is also shown in this chapter, that comments are very often used as an indicator for wrong information. To determine this, the comments were scanned for certain words like e.g. false, wrong. As a result, every fourth comment contained one of these words.

Finally a conclusion of the results and an outlook on potential further research and analysis are given.

Stats
The PDF-Document has been downloaded 46 times.