Current Page: | Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: m05 » Learning Units » Unit ID: 03_25 |
---|---|
Last Modified: | Tuesday, 2015-05-05 - 08:08:58 |
Tools: | Validate — Preview XML Preview HTML Preview PDF |
Alternative: | Printable HTML |
Title: | Fallbeispiel: MusArt | ||
---|---|---|---|
Abstract: | Musart ist ein content-based Music Information Retrieval Project, welches am Institut für Elektrotechnik und Computerwissenschaften der Universität von Michigan/USA durchgeführt wird. Eine Musiksuche wird nicht an Hand einer Textangabe , wie Name des Komponisten, Interpreten etc , durchgeführt, sondern es werden die Musikstücke der Datenbank rein auf ihren musikalischen Gehalt hin untersucht. | ||
Status: | final | Version: | 2004-09-16 |
History: |
2004-09-16 (Thomas Migl): abb. importiert 2004-09-07 (ThomasMigl): in greybox importiert, finalisiert 2004-03-12 (Robert Fuchs): Closed for 50% Content Deadline import in Scholion. 2004-03-11 (Thomas Migl): LOD1, abstract added 2004-03-07 (Robert Fuchs): Fixed invalid <div> in <th>. 2004-03-05 (Robert Fuchs): Imported and tagged content from "m5-LU25-Fallbeispiel_MusArt.doc". |
Author 1: | Thomas Migl | E-Mail: | migl@ims.tuwien.ac.at |
---|---|---|---|
Author 2: | (empty) | E-Mail: | (empty) |
Author 3: | (empty) | E-Mail: | (empty) |
Author 4: | (empty) | E-Mail: | (empty) |
Author 5: | (empty) | E-Mail: | (empty) |
Organization: | Technische Universität Wien; Institut für Softwaretechnik und Interaktive Systeme; Arbeitsgruppe für Interaktive Multimediale Systeme; http://www.ims.tuwien.ac.at/ |
Einführung birm20021Das Projekt MusArt
2Das Projekt MusArtMusart ist ein Music Information Retrieval Project, welches am Institut für Elektrotechnik und Computerwissenschaften der Universität von Michigan/USA durchgeführt wird. Musart ist ein content-based Music retrieval Sytem, dass heißt, eine Musiksuche wird nicht an Hand einer Textangabe , wie Name des Komponisten, Interpreten etc , durchgeführt, sondern es werden die Musikstücke der Datenbank rein auf ihren musikalischen Gehalt hin untersucht. Musart ist ein Lokalisierendes MIR System (siehe Lerneinheit Musikinformationsretrieval, MIR Systeme). Architektur von MusArt birm20021Abbildung: Architektur MusArt PC birm2002Abbildung: Architektur MusArt PDA_Phone birm2002Datenbestand von Musart
Abfrage
2Abbildung: Architektur MusArt PC birm2002Abbildung: Architektur MusArt PDA_Phone birm2002Datenbestand von MusartMusart beinhaltet eine große Anzahl an Musikstücken unterschiedlichsten Genres. Die Musikstücke sind als Mididateien (siehe Midi) repräsentiert. Ein Themenextraktionsprogramm extrahiert automatisch für jede Mididatei die für das Stück charakteristischen musikalischen Themen. Diese Themen werden dann als Metadaten gespeichert. Allerdings werden sie vorher vom Midi Format in ein Hidden Markov Modell konvertiert. Diese Form der Repräsentation ermöglicht eine höhere Trefferquote für einen Retrievalprozess, als wenn man es bei dem Midiformat beließe. AbfrageUm eine Abfrage an Musart zu machen, muss der Benutzer einen kurzen Teil einer Melodie singen, von der er glaubt, dass sie charakteristisch für ein gesuchtes Musikstück ist. Die gesungene Melodie wird über Mikrophon aufgenommen. Aus diesem Audiosignal extrahiert ein Transkriptionsprogramm (=pitch tracker) die Melodie. Diese Melodie wird ebenfalls als Hidden Markow Modell dargestellt. Es wird nun in einer Retrivalmaschine die gesungene Melodie mit den extrahierten Melodien verglichen. Als Ergebnis wird eine Rangliste jener Musikstücke geliefert, die der Abfrage am ähnlichsten sind. Themen Extraktion birm20021auto
Automatische Themenextraktion
Schwierigkeiten automatische Themen Extraktion
Musart MME
Abbildung: Themenextraktion bei Dvoraks „amerikanischem Quartett“ birm2002 PC
bbildung: Themenextraktion bei Dvoraks „amerikanischem Quartett“ birm2002 PDA_Phone
2autoDas Herzstück des Musart Projektes ist die Themenextraktion. Dabei geht man von der empirischen Erfahrung aus, dass nicht der gesamte musikalische Inhalt eines Musikstückes zu dessen Repräsentation notwendig ist, um es eindeutig identifizieren zu können, sondern dass oft nur eine kurze Melodie reicht, um selbst große Symphonien oder ganze Opern damit wieder zu erkennen. Die Frage, welche Themen nun die repräsentativsten für ein bestimmtes Musikstück sind, beschäftigt schon lange Musiktheoretiker, Musiker und Musikbibliothekare. Für Musikarchive werden musikalische Themen von musiktheoretisch versierten Personen manuell identifiziert, indiziert und katalogisiert. Für ein Lokalisierendes MIR System ist eine solche Vorgangsweise praktisch unmöglich. Die manuelle Bearbeitung einer solch großen Anzahl an Musikstücken würde einen viel zu großen Kosten- und Zeitaufwand bedeuten. Automatische ThemenextraktionAls Alternative zur manuellen Indizierung von Hauptthemen eines Musikstückes wurde für das Musart Projekt eine automatisierte Prozedur zur Themenextraktion entwickelt. Schwierigkeiten automatische Themen Extraktion
Musarts MMEDie Themenextraktion MME von Musart basiert auf der Erkenntnis, dass Komponisten wichtige musikalische Themen innerhalb eines Musikstückes öfter wiederholen. Wobei auch hier wieder zu beachten ist, dass die Wiederholungen von verschiedenen Stimmen gespielt werden können.
In vielen Musikstücken werden in den Begleitstimmen immer wieder meist sehr kurze Sequenzen wiederholt. Beispiel sei eine Gitarre, die als Begleitung zu einer Gesangsstimme immer nur Akkordzerlegungen spielt. Solche Begleitstimmen zeichnen sich dadurch aus, dass innerhalb einer Tonsequenz nur wenig unterschiedliche Intervalle vorkommen. Abbildung: Themenextraktion bei Dvoraks „amerikanischem Quartett“ birm2002 PC
Im gezeigten Abschnitt findet MME im ersten Schritt für alle vier Stimmen Tonsequenzen, die öfters wiederholt werden und somit Kandidaten für ein Hauptthema sind. Im zweiten Schritt werden die erkannten Sequenzen auf die Vielfalt ihrer Intervalle überprüft. Man betrachte die ersten beiden Stimmen, die erste und zweite Geige. Sie beinhalten eigentlich nur ein Intervall, nämlich eine Terz. Das ist für MME ein Hinweis, dass es sich bei diesen Sequenzen um reine Begleitstimmen handeln muss und scheidet sie richtigerweise aus. Dasselbe gilt für die Cellostimme. Bei der für die Bratsche erkannten Tonsequenz entdeckt MME eine Vielzahl unterschiedliche Intervalle zwischen den aufeinander folgenden Tönen und klassifiziert diese Tonfolge richtigerweise als ein Hauptthema. bbildung: Themenextraktion bei Dvoraks „amerikanischem Quartett“ birm2002 PDA_Phone
Im gezeigten Abschnitt findet MME im ersten Schritt für alle vier Stimmen Tonsequenzen, die öfters wiederholt werden und somit Kandidaten für ein Hauptthema sind. Im zweiten Schritt werden die erkannten Sequenzen auf die Vielfalt ihrer Intervalle überprüft. Man betrachte die ersten beiden Stimmen, die erste und zweite Geige. Sie beinhalten eigentlich nur ein Intervall, nämlich eine Terz. Das ist für MME ein Hinweis, dass es sich bei diesen Sequenzen um reine Begleitstimmen handeln muss und scheidet sie richtigerweise aus. Dasselbe gilt für die Cellostimme. Bei der für die Bratsche erkannten Tonsequenz entdeckt MME eine Vielzahl unterschiedliche Intervalle zwischen den aufeinander folgenden Tönen und klassifiziert diese Tonfolge richtigerweise als ein Hauptthema. Retrieval Maschine birm20021Fehlerquellen
Umgang mit Fehlern
2FehlerquellenWie bei allen MIR Systemen hat auch die Suchmaschine von Musart mit teilweise signifikanten Fehlern zu kämpfen. Die verschiedenen Fehler kann man in drei Gruppen von Fehlerquellen einordnen
Umgang mit FehlernDie oben beschriebenen Fehlerquellen sind nicht deterministisch, das heißt, man kann im Vornherein nie sagen, welchen Fehler ein bestimmter Benutzer bei einem bestimmten Musikstück machen wird. Daher ist man übergegangen, statt einer deterministischen eine stochastische Beschreibung der Melodie zu wählen. Die verschiedenen MIR Systeme benutzen dazu die unterschiedlichsten Ansätze. Im Projekt Musart wird das Hidden Markov Modell (HMM) verwendet. Es werden sowohl die extrahierten Themen der Musikstücke, wie auch die gesungene Melodie als HMM repräsentiert. Evaluierung von Musart birm20021Testbedingungen
Ergebnisse
2TestbedingungenDer Korpus besteht aus 277 Musikstücken im Midiformat, die die Autoren von Musart aus dem world wide Web zusammen getragen haben. Es handelt sich dabei um Musikstücke aus der Klassik, Musicals, Jazz- und Popmusik der letzten 40 Jahre. Für jedes Stück dieser Stücke extrahierte MME signifikante Hauptthemen., insgesamt 2653. Jedes Thema wurde automatisch in ein Hidden Markov Modell umgewandelt und mit dem entsprechendem Index versehen, der angibt, von welchem Musikstück es sich ableitet. Bei der Evaluierung des Systems wurde jeder Sänger dazu aufgefordert, zuerst drei allgemein sehr bekannte Lieder zu singen: Beatles „Here comes the sun“, Queens „Another One Bites the Dust“, und ein altes amerikanisches Volkslied namens „America the Beautiful “. Jeder Sänger sollte für jedes dieser Stücke eine Melodie singen, die ihm besonders charakteristisch dafür schien. In einem zweiten Durchgang musste jeder Sänger drei weitere Lieder aus den 277 Musikstücken auswählen und wieder die für ihn für das Musikstück charakteristische Melodie singen. Eine Suchergebnis wurde als korrekt anerkannt, wenn dass gesuchte Musikstück unter den ersten 5 in der Rankingliste aufscheint. ErgebnisseDie Tabelle zeigt, dass bei 41,7% der Fälle das gesuchte Musikstück im Suchergebnis an erster Stelle rangierte. 58% der Ergebnissee wurden als richtig anerkannt, weil das gesuchte Musikstück unter den ersten fünf platziert war .In der Tabelle sieht man, in wie vielen Fällen das gesuchte Musikstück an welcher Stelle der Rankingsliste gelegen hat.
|
(empty) |