Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung IOSB

Masterarbeit: Deep Learning-basierte Erkennung von Personenattributen in Videos |[VID]|

Das Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung IOSB ist eines der größten Institute für angewandte Forschung auf dem Gebiet der Bildgewinnung und Bildauswertung in Europa. Die AbteilungVideoauswertesysteme (VID) beschäftigt sich mit der automatischen Auswertung von Signalen bewegter bildgebender Sensorik in komplexen, ggf. nichtkooperativen Szenarien. Diese Sensorik wird beispielsweise im Aufklärungs- und Überwachungsbereich als integrierte Komponente in fliegenden, weltraumgestützten oder mobilen landgestützten Plattformen verwendet. VID entwickelt und integriert hierfür Bildauswertealgorithmen für autonome oder interaktive Systeme.

Beschreibung

Die sogenannte „Pedestrian Attribute Recognition“ versucht, basierend auf Eingabebildern von Personen, automatisiert passende Attribute zuzuweisen. Relevante Attribute sind dabei zum Beispiel das Geschlecht, das Alter oder Informationen zur Kleidung der dargestellten Person. Ein Anwendungsfall ist beispielsweise der Abgleich der erkannten Attribute mit einer semantischen Beschreibung, um eine Person in großen Videodatenmengen finden zu können.
 
[1]

Aufgabenstellung

Im Gegensatz zu anderen Forschungsgebieten wurden im Bereich der Attributerkennung bislang nur wenige Verfahren [2] vorgeschlagen, die die zeitliche Komponente miteinbeziehen. Werden jedoch anstatt Einzelbildern Tracklets einer Person als Eingabe verwendet, kann eine robustere Attributschätzung erreicht werden, weil Fehler, die nur in einzelnen Frames auftreten, korrigiert werden könnnen. Deine Aufgabe besteht darin Verfahren aus anderen Gebieten auf die Attributerkennung zu übertragen und zu evaluieren. Danach kann basierend auf den gewonnenen Erkenntnissen ein eigenes Verfahren entwickelt werden, das die Stärken und Schwächen der untersuchten Verfahren adressiert.

[1] Wang, X. et al.: Pedestrian Attribute Recognition: A Survey, 2019: https://arxiv.org/pdf/1901.07474.pdf
[2] Chen, Z. et al.:  Video-Based Pedestrian Attribute Recognition, 2019: https://arxiv.org/pdf/1901.05742.pdf
[3] MARS Attributes Datensatz: http://irip.buaa.edu.cn/mars_duke_attributes/index.html

 

Voraussetzungen

  • Studienfach: Informatik, Mathematik, Elektrotechnik, Angewandte Physik oder vergleichbar
  • Gute Programmierkenntnisse (idealerweise Python)
  • Fähigkeit zum selbstständigen Arbeiten
  • Bereitschaft, sich in neue Themengebiete einzuarbeiten und Freude am Einbringen eigener Ideen
  • Gutes Verständnis der Grundlagen von Deep Learning
  • Erste praktische Erfahrungen mit CNNs wünschenswert
  • Bewerbungen bitte mit Lebenslauf und Notenauszug