Titelaufnahme

Titel
Automatic topic detection in song lyrics / Kleedorfer, Florian
VerfasserKleedorfer, Florian
Begutachter / BegutachterinWidmer, Gerhard
Erschienen2008
Umfang154 Bl. : Ill., graph. Darst.
HochschulschriftLinz, Univ. u. Wien, Tech. Univ., Dipl.-Arb., 2008
Anmerkung
Zsfassung in dt. Sprache
SpracheEnglisch
DokumenttypDiplomarbeit
Schlagwörter (DE)Text Mining / Themenerkennung / Clustering / Maschinelles Lernen / Musik / Information Retrieval / Suche / Liedtexte
Schlagwörter (EN)text mining / topic detection / clustering / machine learning / music / information retrieval / search / song lyrics
URNurn:nbn:at:at-ubtuw:1-26790 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Automatic topic detection in song lyrics [0.74 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

In der vorliegenden Arbeit wird ein Algorithmus zur automatischen Erkennung von Themen in Liedtexten vorgestellt. Dieser besteht hauptsachlich aus der Anwendung von Methoden des Textmining und dem anschließenden Einsatz von Clustering mittels non-negative matrix factorization (NMF).

Die dabei entstehenden Cluster werden handisch benannt. Diese Benennung wird in einer kleinen Studie von Versuchspersonen vorgenommen. Die Studie belegt, dass die identifizerten Themen konsistent und erkennbar sind.

Durch die Anwendung der prasentierten Methode auf eine Musiksammlung wird ein Information Retrieval System erstellt, das es erlaubt, die Sammlung nach Themen und Themenkombinationen zu durchsuchen.

Zusammenfassung (Englisch)

We propose an algorithm for the automatic detection of topics in song lyrics.

It mainly consists in the application of basic text mining techniques on a lyrics collection and clustering the terms found in the lyrics into topics by using non-negative matrix factorization (NMF). The resulting clusters are labeled by hand. A small-scale evaluation is used in order to create these labels.

The study proves that the identified topics are coherent and recognizable.

The result of applying our method to a collection of songs is an information retrieval system which can be queried for topics and topic combinations.