Image categorisation through Boosting using cost-minimising strategies for data labelling

Publikationen: Thesis / Studienabschlussarbeiten und HabilitationsschriftenDissertation

Abstract

Frühere Arbeiten haben gezeigt, dass AdaBoost eine leistungsstarke Methode zur Bildkategorisierung ist. Dabei wurde AdaBoost dazu verwandt, unterschiedliche Merkmale auszuwählen, um einen Klassifikator gegen eine Klasse von Hintergrundbildern zu lernen. Wie in früheren Arbeiten beschrieben, werden neue Erweiterungen dieses Frameworks vorgestellt: (a) die Ergänzung des schwachen Lerner um geometrische Relationen zwischen Merkmalen und (b) die Entwicklung einer Methode zur Optimierung von Gewichten, um binäre Klassifikatoren im Rahmen der Mehrklassen-Klassifikation miteinander zu verknüpfen. Unser Framework wird anhand des Xerox-Datensatzes evaluiert, wobei wir unsere Ergebnisse mit denen des "bag-of-keypoints"-Ansatzes vergleichen. Zudem präsentieren wir unsere Ergebnisse von der "PASCAL VOC Challenge 2006". Obwohl die Menge verfügbarer Bilder aus Bilddatenbanken usw. riesig ist, erweist sich die Beschaffung der notwendigen Klasseninformation zum Lernen eines Klassifikators üblicherweise als sehr teuer. Eine Möglichkeit, mit dem generellen Problem der kostspieligen Kennzeichnung umzugehen, ist das aktive Lernen. Hierbei werden die zu kennzeichnenden Datenpunkte mit dem Ziel ausgewählt, einen Klassifikator zu erstellen, dessen Ergebnis besser ist, als jenes eines Klassifikators, der auf einer genauso großen Anzahl zufällig gezogener Datenpunkte trainiert wurde. Frühere Arbeiten haben gezeigt, dass aktives Lernen das Ergebnis gegenüber passivem Lernen verbessert. Allerdings wird die grundlegende Frage, ob neue Datenpunkte überhaupt erfragt werden sollen, selten behandelt. Diese Arbeit befasst sich direkt mit Kennzeichungs-Kosten, wie es in einem unserer früheren Artikeln vorgeschlagen wurde. Das Lernziel wird als Minimierung von Kosten definiert, was eine Funktion der erwarteten Modellgüte und der gesamten Kosten der verwendeten Kennzeichnungen darstellt. Dies erlaubt es, allgemeine Strategien und spezifische Algorithmen zu entwickeln, um (a) optimal zu stoppen, wobei anhand der zu erwartenden Kosten bestimmt wird, ob das weitere Kennzeichnen angehalten werden soll und (b) empirisch auszuwerten, wobei Kosten als Leistungsmetrik für eine gegebene Kombination aus Lern-, Stopp- und Datenauswahlverfahren genutzt werden. Obwohl der Hauptfokus optimales Stoppen ist, beabsichtingen wir auch, einen Grundlage für weitere Entwicklungen und Diskussionen im Bereich des aktiven Lernens bereitzustellen. Die vorgeschlagene Evaluierungsmethode wird durch experimentelle Ergebnisse unterlegt und demonstriert den Nutzen des vorgeschlagenen Stopp-Verfahrens.

Details

Titel in ÜbersetzungBildkategorisierung durch Boosting mithilfe kostenminimierender Strategien beim Kennzeichnen von Daten
OriginalspracheEnglisch
QualifikationDr.mont.
Betreuer/-in / Berater/-in
  • Palm, Günther, Beurteiler B (extern), Externe Person
  • Auer, Peter, Beurteiler A (intern)
StatusVeröffentlicht - 2009