Current Page: | Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: m06 » Learning Units » Unit ID: 1_1_04 |
---|---|
Last Modified: | Tuesday, 2015-05-05 - 08:09:02 |
Tools: | Validate — Preview XML Preview HTML Preview PDF |
Alternative: | Printable HTML |
Title: | Ähnlichkeitsabfragen und Demosysteme | ||
---|---|---|---|
Abstract: | Diese
Lerneinheit ist zweigeteilt. Im ersten Teil werden Ähnlichkeitsabfragen bezüglich der Farbe näher behandelt. Erklärt werden Farbhistogramme, indizierte Farben, Ähnlichkeitsmetriken und Einschränkungen von Farbzuordnungen. Im zweiten Teil stellen wir drei unterschiedliche Multimedia Abfragesysteme vor: QBIC, WebSeek und VideoQ |
||
Status: |
Review II: done |
Version: | 8.0 |
History: |
Formeln bei quadr. Ähnlichkeit mit MathML gesetzt, Bib OK Acronyme, Absätze, Wordanführungszeichen done. @ Prof. Kosch: Überschriften für "Demo Systeme" LOD2 finden done. Review von Prof. Kosch eingearbeitet. Unbekannte Character gecheckt. Bei Formeln Block Typ entfernt. |
Author 1: | Harald Kosch | E-Mail: | harald.kosch@itec.uni-klu.ac.at |
---|---|---|---|
Author 2: | (empty) | E-Mail: | (empty) |
Author 3: | (empty) | E-Mail: | (empty) |
Author 4: | (empty) | E-Mail: | (empty) |
Author 5: | (empty) | E-Mail: | (empty) |
Organization: | Universität Klagenfurt - Institut für Informatik-Systeme |
Ähnlichkeitsabfragen Farbe1Histogramm Darstellung (Farbe)
Auto PCAuto PDA_PhoneAuto PCAuto PDA_PhoneQuantifizierung: Farbe
ÄhnlichkeitsmetrikenMinkowski ÄhnlichkeitDistanz L1 : r = 1 Distanz L2 : r = 2 Auto PCAuto PDA_PhoneQuadratische ÄhnlichkeitSchnittmengen Ähnlichkeit (Swain et Ballard 1991)
Auto PCAuto PDA_PhoneEinschränkung
Auto PCAuto PDA_Phone2Histogramm Darstellung (Farbe)Farbverteilungen können durch Histogramme dargestellt werden. Auto PCAuto PDA_PhoneAuto PCAuto PDA_PhoneAutoDie Farbhistogramme werden erzeugt, indem diskrete Farbabschnitte gebildet werden und die Anzahl der Pixel gezählt wird, die in die jeweiligen Farbabschnitte fallen. Die Werte der Achsen sind hier der Farbwert und die prozentuelle Übereinstimmung. Quantifizierung: FarbeQuantifizieren (="Zählbarmachung") ist ein wissenschaftliches
Verfahren zur Umformung. Eigenschaften eines Gegenstands oder die
Beschaffenheit eines Sachverhaltes werden so umformuliert, dass sie
in messbaren Größen erfasst werden können. Dieses Verfahren wird auch
bei Farben angewendet. In jeder Gruppe wird dann berechnet, wie viele Pixel in diese Gruppe fallen. Danach werden die Zellwerte durch eine Anzahl von festen Bits codiert - womit die Quantifizierung abgeschlossen ist. ÄhnlichkeitsmetrikenMehrere Ähnlichkeitsmetriken sind in der Anwendung. Am häufigsten wird die Minkowski Ähnlichkeit benutzt: Minowski ÄhnlichkeitAuto PCAuto PDA_PhoneAutohq und ht sind die Signaturvektoren des Abfrage- bzw. des Zielbildes.
In der Formel werden dann die einzelnen Werte der beiden Vektoren
subtrahiert. Das absolute Ergebnis dieser Substraktion wird dann hoch
den Faktor r gerechnet. Nachdem die Abstände der Vektoren so aufsummiert
wurden, wird das Ergebnis hoch dem Kehrwert von r, als 1/r gerechnet. Quadratische ÄhnlichkeitDie Quadratische Ähnlichkeit ermittelt auch die einzelnen Abweichungen zwischen Abfrage- und Zielbild.
ist eine N x N Matrix wobei aij der Ähnlichkeitskoeffizient zwischen
den Dimensionen i und j ist. Schnittmengen ÄhnlichkeitDie Schnittmengen Ähnlichkeit hat eine etwas andere Berechnung: Auto PCAuto PDA_PhoneAutoBei dieser Metrik werden irrelevante Elemente aus den Signaturvektoren herausgefiltert. hq und ht sind hier wieder die Signaturvektoren des Abfrage- bzw. des Zielbildes. Es wird jeweils der kleinere Wert im Vektor ausgewählt und aufsummiert. Dann wird das Ergebnis durch die Summe der Werte des Zielbildes dividiert und man erhält d. Sie wird typischerweise für eine Objekt (Teil eines Bildes)-Bild Abfrage benutzt. EinschränkungÄhnlichkeitsmetriken basierend auf Histogrammen ignorieren Ähnlichkeit
zwischen Farben: Auto PCAuto PDA_PhoneAutoFarbhistogramme sind zwar eine geeignete Darstellung für Farbverhältnisse, dennoch können sie alleine nicht als Ähnlichkeitsmerkmal herangezogen werden. Die obigen zwei Bilder ergeben laut Farbhistogramm eine 100% Ähnlichkeit, jedoch ist die Verteilung der Farben grundverschieden. Daher ist es wichtig, auch die räumliche Beziehung bzw. Struktur zu beschreiben. Eine Möglichkeit ist die Zuhilfenahme eines Strukturelements, wie z.B. der MPEG31-7 Color Structure Desciptor realisiert. Populäre Content-based Retrieval Systeme1Auto
QBIC (IBM's Query By Image Content) Eigenschaften und Eigenschaften
WebSeek
Auto PCAuto PDA_PhoneAuto PCAuto PDA_PhoneVideoQVideoQ: Video Suchmaschine
Auto PCAuto PDA_Phone2AutoQBIC (IBM's Query By Image Content)
ist eine Bildsuchmaschine. Das System kommt beispielsweise auf der
Homepage des Hermitage Museum Petersburg zum Einsatz (http://www.hermitagemuseum.org).
Die virtuelle Galerie gibt dem Besucher der Website die Möglichkeit,
Gemälde des Museums durch Farbanteile oder Layout zu suchen (http://www.hermitagemuseum.org/fcgi-bin/db2www/qbicSearch.mac/qbic?selLang=English). WebSEEk, entwickelt an der New Yorker
Columbia-Universität, ist ein nach Sachgebieten geordnetes Bildverzeichnis
mit Bildern und Videos. Es kann nach Stichworten oder via Text gesucht
werden, wobei das Suchergebnis auf Video, Farbfoto, Schwarzweißbilder
oder Graphiken eingeschränkt werden kann. VideoQ ViQ04, eine Video Suchmaschine wurde auch auf der Columbia Universität entwickelt. Individuelle Videos werden automatisch in seperate Shots segmentiert. Gegenwärtig werden über 2000 Shots in der großen Digital-Video Datenbank gespeichert. Jeder Shot wird komprimiert und in drei Schichten gespeichert, um unterschiedliche Bandbreiten zu unterstützen (30 - 7,5 Bilder/Sekunde). VideoQ ist unter http://www.ctr.columbia.edu/videoq erreichbar. QBIC (IBM's Query By Image Content) EigenschaftenQBIC wurde 1995 vom IBM Almaden Research Center entwickelt. Es ermöglicht die Suche mittels Beispielbildern, interaktiv gezeichneten Formen und unterschiedlichen Farb- und Texturmustern. Es ist in die Multimedia Extenders der IBMDB2 integriert. Bei der Eigenschaftsextraktion der Farbe wird ein Farbhistogramm definiert. Dazu wird der Farbraum festgelegt: Berechnung der durchschnittlichen Munsell (Miyahara, et.al., 1988) Koordinaten für jedes Objekt und Bild. Danach folgt die Berechnung der Farbhistogramme: Das k Element Farbhistogramm (k ist typischerweise 64 oder 256) gibt den Prozentsatz der k Farben pro Pixel in jedem Bild an. Die Textureigenschaften beruhen auf Granularität, Kontrast und Gerichtetheit (H. Tamura, et.al., 1987). Bei der Granularität wird die Abstufung der Textur, also die Grössenordnung gemessen (Kiesel vs. Felsblöcke). Beim Kontrast wird zwischen Lebendigkeit und Unruhe der Textur unterschieden (unifarben vs. gemustert). Bei der Gerichtetheit wird das Vorhandensein von Richtungen beschrieben (Gras - begünstigte Richtung vs. glattes Objekt - isotrop). Bei den Formeigenschaften werden unterschiedliche Formen verwendet. Eine beruht auf einer Kombination von Fläche (Anzahl der Pixel im Formenkörper), Kreisförmigkeit (Kreisfläche/Umfang²), Exzentrizität und eine Menge von algebraischen Moment-Invarianten. Eine zweite ist der sich drehenden Winkel oder die Tangenten-Vektoren um den Umkreis eines Objekts, berechnet von einer glatten Spline passend zum Umkreis. Das Ergebnis ist eine Liste von 64 Werten von drehenden Winkeln. WebSeekAuto PCAuto PDA_PhoneAutoIn WebSeek sammeln selbständige Web-agents oder "spiders" Bilder und Videos aus dem Internet. Die "spiders" durchlaufen das Web indem sie Hyperlinks zwischen Dokumenten folgen. Sie spüren so Bilder und Videos auf, überarbeiten sie und fügen die neue Information dem Katalog hinzu. Dieser Sammelprozess wird durch drei Module ermöglicht:
Auto PCAuto PDA_PhoneAutoDie Graphik beschreibt die Funktionsweise des Inhaltsextraktors.
VideoQDie Segmentierung in Video Shots, die Bewegungsanalyse mit Hilfe des sechs Parameter Affine Modell und die Verfolgung erfolgt automatisch. Das VideoQ System will allen Benutzern ermöglichen, nach Videos mittels visueller Merkmale und räumlich-zeitlichen Beziehungen zu suchen. Die Videosuchmaschine kann unter http://www.ctr.columbia.edu/videoq mit 3.000 Video Clips, aus denen 30.000 Video Objekte extrahiert wurden getestet werden. Um ein Video zu finden, kann man dies entweder durch textuelle oder visuelle Suche tun oder auch mittels dem Video Navigator durch die nach Kategorien strukturierten Clips browsen. Auto PCAuto PDA_PhoneAutoVideoQ ist ein webbasiertes Videosuchsystem, bei dem der Benutzer mittels animierter Entwürfe Abfragen an das System stellen kann. Ein animierter Entwurf wird als eine Skizze definiert, in welcher der Benutzer Bewegungen in jedem Teil der Szene festsetzen kann. Diese Skizzen sind eine Sammlung von Objekten, die verschiedene Eigenschaften haben: Bewegung, räumlich-zeitliche Ordnung, Form und auch Farbe und Textur. Der Abfrageserver enthält eine Eigenschaftsdatenbank, welche die individuellen Merkmale der Videos speichert. Die Video Shot Datenbank enthält komprimierte MPEG31-Streams. Wenn der Benutzer seine Anfrage an das System übermittelt, sendet der Client sie über das Netzwerk zum Abfrageserver. Dort werden die Daten mit den Objekten in der Datenbank abgeglichen. Dann wird für jedes in der Abfrage spezifizierte Objekt eine Liste von Video-Shot Kandidaten generiert. Die Kandidaten werden dann zu einer Liste gruppiert und es werden Schlüsselbilder von der Video-Shot Datenbank extrahiert. Die übereinstimmenden Objekte werden in den Schlüsselbildern markiert. Der Benutzer kann interaktiv die Ergebnisse über das Netzwerk betrachten, indem er einfach ins Schlüsselbild klickt. So wird der VideoShot in Realtime aus der Datenbank "geschnitten" und steht dem Benutzer zur Verfügung. Die gesamte Video Datenbank wird off-line verarbeitet. Die individuellen Videos werden in separate Shots zerlegt. Dann, innerhalb jedes Shots, werden Video Objekte quer durch Frames aufgespürt. Als Eigenschaften werden aber auch Schlüsselwörter herangezogen. Bibliographie2AutoLu99 QBI04 Kos03 WES04 ViQ04 |
(empty) |