Bachelor- oder Masterarbeit: Crowd-level Person Pose Estimation

Das Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung IOSB ist eines der größten Institute für angewandte Forschung auf dem Gebiet der Bildgewinnung und Bildauswertung in Europa. Die Abteilung Videoauswertesysteme (VID) beschäftigt sich mit der automatischen Auswertung von Signalen bewegter bildgebender Sensorik in komplexen, ggf. nichtkooperativen Szenarien. Diese Sensorik wird beispielsweise im Aufklärungs- und Überwachungsbereich als integrierte Komponente in fliegenden, weltraumgestützten oder mobilen landgestützten Plattformen verwendet. VID entwickelt und integriert hierfür Bildauswertealgorithmen für autonome oder interaktive Systeme.

Datenschutz und Datenverarbeitung

Wir setzen zum Einbinden von Videos den Anbieter YouTube ein. Wie die meisten Websites verwendet YouTube Cookies, um Informationen über die Besucher ihrer Internetseite zu sammeln. Wenn Sie das Video starten, könnte dies Datenverarbeitungsvorgänge auslösen. Darauf haben wir keinen Einfluss. Weitere Informationen über Datenschutz bei YouTube finden Sie in deren Datenschutzerklärung unter: http://www.youtube.com/t/privacy_at_youtube

Bei der Schätzung von Skelettposen von Personen, geht es darum aus Bilddaten relevante Keypoints zu extrahieren und diese zu einer Skelettdarstellung einer Person zu überführen. Die Schätzung von Posen einzelner Personen findet in diversen Bereichen wie bei Spielekonsolen oder der heimischen Assistenzrobotik Verwendung. Häufig werden hierbei jedoch nur einzelne oder wenige Personen auf einmal betrachtet.

Ziel dieser Arbeit ist es mithilfe aktueller Deep Learning Verfahren zur Extraktion von Skelett-Posen aus 2D-Bilddaten zu untersuchen, in wie weit sich diese Verfahren auch für größere Menschenmengen verwenden lassen und diese dabei hinsichtlich Robustheit und Echtzeitfähigkeit zu vergleichen. Insbesondere Untersucht werden sollen die Verwendung von Expertenwissen wie z. B. das Wissen über die menschliche Anatomie, die Positionierung der Kamera, Simulationsdaten (z. B. Grand Theft Auto V) aber auch temporale Aspekte.

Beispielpaper: http://ieeexplore.ieee.org/document/8099626/

 

Voraussetzungen

  • Studienfach: Informatik, Mathematik, Elektrotechnik, Maschinenbau, Angewandte Physik, o.ä.
  • Gutes Verständnis für die (theoretischen) Grundlagen von Deep Learning
  • Erste Erfahrung mit Deep Learning Frameworks wie PyTorch oder Tensorflow
  • Gute Programmierkenntnisse (idealerweise Python)
  • Fähigkeit zum selbstständigen Arbeiten
  • Bereitschaft, sich in neue Themengebiete einzuarbeiten und Freude am Einbringen eigener Ideen

Inspiration für weitere Themen: https://thomasgolda.github.io/students/

Bewerbungen bitte mit Lebenslauf und Notenauszug an Thomas Golda.