Titelaufnahme

Titel
Tool support for acoustic evaluation of music similarity / Andreas Senfter
VerfasserSenfter, Andreas
Begutachter / BegutachterinRauber, Andreas ; Lidy, Thomas
Erschienen2008
UmfangXIV, 103 S. : Ill., zahlr. graph. Darst.
HochschulschriftWien, Techn. Univ., Dipl.-Arb., 2008
Anmerkung
Zsfassung in dt. Sprache
SpracheEnglisch
DokumenttypDiplomarbeit
Schlagwörter (DE)cLynx / PlaySOM / Organisation von Musik / maschinelles Lernen / Ähnlichkeiten zwischen Musikstücken
Schlagwörter (EN)cLynx / PlaySOM / music clustering / Self-Organizing Map / music similarity
URNurn:nbn:at:at-ubtuw:1-28694 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Tool support for acoustic evaluation of music similarity [25.92 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Die starke Zunahme von öffentlichen und privaten Musikarchiven, zusammen mit dem stetigen Wachstum an angebotenen Musikstücken, forderte die Entwicklung innovativer Zugangsmöglichkeiten zur Musik. Ein schnelles und effizientes Auffinden gewünschter Musiktitel in riesigen Musiksammlungen erfordert eine leicht verständliche, intuitive Organisation der zugrunde liegenden Daten. Viele solcher Strukturierungsansätze basieren auf der Definition eines Ähnlichkeitsmaßes zwischen den einzelnen Musikstücken, was im Grunde der alltäglichen menschlichen Strukturierungsgewohnheit entspricht. Die Grundlage der technischen Umsetzung bildet die Beschreibung einzelner Werke anhand von mehreren Merkmalen, die aus den Stücken extrahiert werden. Die Gesamtheit der gewonnenen Merkmale bildet einen so genannten Feature Vector, welcher die Struktur des Musikstückes beschreibt. Unter Verwendung dieser Vektoren vollbringen innovative Techniken aus dem Gebiet des maschinellen Lernens (z.B. Self Organizing Map) die Strukturierung eines gesamten Musikarchivs.

Die subjektive Auffassung und Bewertung von Ähnlichkeiten zwischen musikalischen Werken sind von Mensch zu Mensch verschieden, da die musikalische Wahrnehmung und das Ähnlichkeitsempfinden in natürlicher Weise vom Prozess der subjektiven Interpretation und der logischen Schlussfolgerung abhängig sind. Somit ist es möglich, dass eine Musiksammlung Stücke derselben Struktur beinhaltet aber von der menschlichen Wahrnehmung als absolut unähnlich aufgefasst wird. Aus diesem Grund ist die Evaluierung von Ähnlichkeitsmaßen zwischen Musikstücken eine hoch komplizierte Aufgabe, die hauptsächlich mit Hilfe von Hörstudien durchgeführt wird.

Diese Diplomarbeit richtet ihr Hauptaugenmerk auf die akustische Evaluierung von Ähnlichkeitsmaßen. Dazu wird das Tool cLynx präsentiert, welches mehrere unterschiedliche Funktionen zur Unterstützung akustischer Evaluierung bereitstellt und des Weiteren ein effizienteres Erkunden von strukturierten Musikarchiven ermöglicht. Das Tool cLynx wurde in einer Hörstudie verwendet, um seine Eignung in unterschiedlichen Hörsituationen zu analysieren und um Beziehungen zwischen der subjektiven Interpretation und der individuellen Vorliebe von Testobjekten und deren musikalischen Ähnlichkeitsempfinden und Empfindlichkeitsmaß zur Erkennung unpassender Passagen zu erkunden.

Zusammenfassung (Englisch)

The increasing number of music libraries offering an ever growing number of tracks on public and private domains stimulated the demand for innovative approaches to let users access their music. Fast and efficient access to requested audio data in huge music collections requires intuitive organization structures. Various different structuring methods have been applied to this problem, many based on the specification of a similarity measurement between the music tracks. This kind of organization process represents the human, intuitive procedure of structuring. Technical systems implementing this structuring approach, namely music similarity systems, characterize elements of big music repositories based on configurations of features extracted from each song of the collection. Such a feature vector describes the underlying audio content by capturing important aspects of music, e.g.

pitch, timbre, tempo, beat. Using these vectors, several innovative techniques, e.g. the Self-Organizing Map, perform an organization of the whole music collection. In order to offer a graphical representation to the user, topology-preserving mapping techniques perform a projection of those multidimensional descriptors to a 2-dimensional lattice. This enables the user to explore the music by moving across a plane.

The evaluation of the quality of similarity measures between pieces of music is a non-trivial, sophisticated task because human cognition of music and perception of similarity inherently is biased by subjective interpretation and reasoning which usually is based on knowledge and conventions of the real world. Even songs belonging to the same genre, having a similar structure might be recognized as completely dissimilar by human cognition. Therefore, the evaluation of similarity between music tracks typically requires human judgment.

This work focuses on the acoustic evaluation of music similarity. It presents a novel tool called cLynx which offers several different features for an efficient acoustic evaluation of music similarity and additionally enables exploring and analyzing structured audio repositories much faster and more efficiently. An evaluation based on a listening test studies the applicability of cLynx in various listening situations by highlighting trends in the subjects' perceptions and analyses connections between subjective interpretation and individual preferences and the subjects' perception of music similarity and susceptibility to outlier detection.