Current Page: | Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: m06 » Learning Units » Unit ID: 1_1_03 |
---|---|
Last Modified: | Tuesday, 2015-05-05 - 08:09:01 |
Tools: | Validate — Preview XML Preview HTML Preview PDF |
Alternative: | Printable HTML |
Title: | MMDBMS Indizierung | ||
---|---|---|---|
Abstract: | Diese Lerneinheit befasst sich mit Indizierung in einer Multimediadatenbank. Erst wird auf die Indizierung von Audio und Video näher eingegangen. Dann folgt ein Beispiel einer Bildindizierung. | ||
Status: | Review II: done. | Version: | 8.0 |
History: |
Review eingearbeitet, Bib OK Acronyme, Absätze, Wordanfürhungszeichen done. Review von Prof. Kosch eingearbeitet. auf unbekannte Character gecheckt |
Author 1: | Harald Kosch | E-Mail: | harald.kosch@itec.uni-klu.ac.at |
---|---|---|---|
Author 2: | (empty) | E-Mail: | (empty) |
Author 3: | (empty) | E-Mail: | (empty) |
Author 4: | (empty) | E-Mail: | (empty) |
Author 5: | (empty) | E-Mail: | (empty) |
Organization: | Universität Klagenfurt - Institut für Informatik-Systeme |
Indizierung in MM-Datenbanken1MMDBMS Indizierung
Indizierung von Multimedia und Eigenschaften
Indizierung von Bildern
Audio-Indizierung
Video-Indizierung
Indizierung in einer MultimediadatenbankDie folgende Graphik zeigt die Stellung der Indizierung in einer Multimedia Datenbank: Auto PCAuto PDA_Phone
2MMDBMS IndizierungIn traditionellen Datenbanken werden in den meisten Fällen Schlüsselwörter zur Indizierung verwendet. Indizierung ist hier die Erstellung einer Indextabelle für Daten oder allgemein die Kennzeichnung von Daten bzw. Datensätzen nach bestimmten Kriterien. Der Index erfasst jeden Datensatz mittels eines Schlüssels und gibt seine Adresse an. Die Indizierung in MM-Datenbanken ist inhaltsbasiert. Das bedeutet, dass die Daten zur Indizierung direkt aus den Multimediadaten extrahiert werden. Diese Merkmale sind meist (unglücklicherweise) im low-level Bereich, d.h.: Farbe, Form, Textur, Bewegung, etc. Aber auch high-level Merkmale(=semantische Inhalte), können für die Indizierung herangezogen werden. Um eine genauere Repräsentation zu ermöglichen, werden die Multimedia Daten in Segmente aufgeteilt und bekommen aussagekräftige Attribute für den gesamten Bereich. Die für die Indizierung relevanten Daten können entweder manuell oder durch eine automatische Analyse extrahiert werden. Beim manuellen Indizieren, wird erst eine Segmentierung vorgenommen. Die Objekte und ihre Beziehungen werden als solche erkannt und mit Schlüsselbegriffen versehen. Die automatische Analyse sucht nach mathematischen Charakteristika in den Inhalten. Hierbei werden je nach Typ (Bild, Text, Video oder Audio) verschiedenste Techniken angewandt. Die automatische Indizierung kann auch manuell korrigiert werden. Indizierung von Multimedia und EigenschaftenEin Multimediaobjekt besteht aus verschiedenen Medientypen (Bild,
Video, Audio,…) oder auch aus weiteren Multimediaobjekten. Repräsentiert
wird es als eine Zusammenstellung von Eigenschaften, beispielsweise
durch einen Signaturvektor. In solchen Vektoren werden verschiedenste
Attribute abgespeichert, für ein Bild z.B.: Farben, Textur, Struktur,
etc. Indizierung von BildernDie Indizierung von Bildern erfolgt in der Regel automatisch. Als erster Schritt wird das Bild in Bereiche eingeteilt, die gemeinsame low-level Eigenschaften, wie Farbe oder Textur aufzeigen. Die Aufteilung erfolgt mit homogenen Prädikaten, welche die Bedingungen für eine solche Segmentierung definieren. Bei einem Farbbild wird die Segmentierung bezüglich der Farbe so vorgenommen: Es werden benachbarte Zellen, deren Pixelwerte ähnlich sind, gesucht. Diese werden dann zu einem Segment gruppiert und es kann ihnen eine Eigenschaft, in diesem Fall die Farbe, zugewiesen werden. Bei der Indizierung werden dann low-level Eigenschaften erkannt und zugewiesen (z.B. Formen: Haus, Auto; Farben). Das Erkennen von high-level Eigenschaften ist schon wesentlich komplizierter, da sie den semantischen Inhalt betreffen. Daher wird die Indizierung von high-level Eigenschaften oft manuell durchgeführt bzw. die automatische Erkennung manuell korrigiert (semi-automatische Indizierung). Audio-IndizierungBei der Indizierung von Audio-Daten wird auch zunächst der Strom
in eigene, homogene Bereiche aufgeteilt (z.B. Klangfarbe, Phrasen,
etc.). Diese Segmentierung in Sequenzen wird jedoch oft manuell durchgeführt.
Die Indizierung selbst erfolgt dann wieder automatisch.
Video-IndizierungDie Video-Indizierung beginnt damit, das Video in Teilbereiche (Videosegmente) zu segmentieren. Objekte und Aktivitäten werden in den einzelnen Segmenten gekennzeichnet und können dann für die Indizierung verwendet werden. Die Videosegmentierung beruht häufig auf der Erkennung von so genannten Videoshots. Videoshots sind kurze Sequenzen von zusammenhängenden Video-Frames, die eine gemeinsame Eigenschaft haben, wie z.B.: die gleiche Szene beschreiben, Präsenz eines bestimmten Objektes oder vom Benutzer als Shot ausgewählt. Aber auch Kamera Bewegungen können für die Aufteilung herangezogen werden. Außerdem kann man auch eine Abgrenzung durch Eigenschaften des Tons (z.B.: andere Melodie, anderer Sprecher) herausfinden. Weiterführende Videosegmentierung kann auch durch heuristische Regeln erfolgen, die durch die Typ-spezifische schematische Struktur des Videos (z.B.: Sport, Dokumentation) oder durch bestimmte Stichwörter ihre Anwendung finden. Bei den Stichwörtern löst z.B. der Auftritt einer Schlüsselperson eine Aufteilung in ein neues Segment aus. Indizierung in einer MultimediadatenbankDie folgende Graphik zeigt die Stellung der Indizierung in einer Multimedia Datenbank: Auto PCAuto PDA_PhoneAutoWie die Graphik zeigt, werden die gegebenen Multimedia Daten nach Extraktion ihrer Eigenschaften in die Datenbank gespeichert. Hierfür werden, je nach Typ, verschiedene Darstellungen benötigt (z.B.: als Binary Large Object (BLOB407) für Bilder). Wenn die Multimedia Daten in der Datenbank sind, kann der Benutzer über eine Schnittstelle Abfragen mit Hilfe von Ähnlichkeitsmetriken an die Datenbank stellen. Das Ergebnis wird dann wieder an der Schnittstelle für den Benutzer bereitgestellt. Bild Beispiel1Indizierung von SchmetterlingenWir wollen Benutzern, die kein Expertenwissen haben, ermöglichen, für einen gesehenen Schmetterling ein paar mögliche Arten (mit Hilfe des Aussehens des gesehenen Schmetterlings) herauszufinden. Bild-Eigenschaftsbeschreibung
Auto PCAuto PDA_PhoneAuto
Auto PCAuto PDA_PhoneWertepaare für obiges Bild, die in Eigenschafts-Deskriptoren gespeichert werden.
Farbe
Textur
Form
2Indizierung von SchmetterlingenDie Indizierung eines Bildes wird nun anhand eines Schmetterlings beispielhaft erklärt: Ein Benutzer ohne Expertenwissen hat einen Schmetterling gesehen. Er will nun herausfinden, welche Art er gesehen hat. Anhand des Aussehens können dann einige in Frage kommenden Arten dem Benutzer gezeigt werden. Auto PCAuto PDA_PhoneAutoZunächst erfolgt eine Eigenschaftsbeschreibung. Es werden Metadaten gefunden, die das Äußere dieses Schmetterlings beschreiben, dazu zählen Farbe, Form und Textur. Diese Eigenschaften werden in Eigenschafts-Deskriptoren gespeichert. Ein Deskriptor besteht aus einem Wertepaar: der Eigenschaftswert (z.B. welche Farbe) und der Grad der Übereinstimmung. Auto PCAuto PDA_PhoneWertepaare für obiges Bild, die in Eigenschafts-Deskriptoren gespeichert werden.
AutoDiese Tabelle enthält die Wertepaare für das Beispielbild, die in Eigenschafts-Deskriptoren gespeichert werden. Farbe
AutoWie man in der Tabelle sieht, ist jede Farbe genau spezifiziert. Weicht die Farbe des Schmetterlings ein wenig von der gegebenen Farbe ab, vermindert das den Grad der Übereinstimmung (z.B. dunkelgrün statt grün). Textur
AutoAuch bei der Textur gibt es unterschiedliche Eigenschaftswerte, die, je nach Übereinstimmung, gewichtet in den Eigenschafts-Deskriptor aufgenommen werden. Form
AutoUnd zum Schluss wird die Form des gegebenen Schmetterlings mit den gespeicherten Formen verglichen und die Übereinstimmung in Form eines Deskriptors gespeichert. Bbiliographie2AutoLu99 Kos03 |
(empty) |