»Wir machen Deep Learning robuster«

Die besonderen Herausforderungen datengetriebener Verfahren: Wie geeignete Werkzeuge für ausreichend Trainingsdaten sorgen und Fehlklassifikationen vermeiden helfen können

Herr Dr. Arens, KI-Verfahren sind sehr leistungsfähig, etwa wenn es darum geht Bilder zu klassifizieren. Dennoch finden sie nur verhalten den Weg in praktische Anwendungen. Warum?

Michael Arens: Neben ihrer Leistungsfähigkeit erregen Deep-Learning-Verfahren auch immer wieder mit verblüffenden Fehlleistungen Aufmerksamkeit: Mit gezielt gewählten Eingabedaten sind KI-Verfahren oftmals überfordert. Für uns ist deshalb Robustheit ein großes Thema: Wie sicherstellen, dass die KI in allen Situationen das gewünschte Ergebnis liefert und nicht zum Beispiel einen Schmetterling wegen einer bestimmten Wolkentextur im Hintergrund plötzlich für ein Flugzeug hält? Dass so etwas passieren kann, liegt am Paradigmenwechsel, den maschinelle Lernverfahren gebracht haben: Nicht mehr der Algorithmus ist entscheidend, sondern die Trainingsdaten, aus denen die KI lernt und dabei Millionen von Parametern festlegt, die hinterher in einer Art Black Box – auf komplexe, kaum nachvollziehbare Weise – bestimmen, welchen Output ein gegebener Input liefert.

 

Der Schlüssel zur Robustheit liegt also in den Trainingsdaten?

Arens: Genau. Die Trainingsdaten sind meine Problembeschreibung. Sie müssen idealerweise die ganze Bandbreite dessen abdecken, was später als Input kommen kann. In unsere Arbeiten spielen aber auch weitere Aspekte hinein. Etwa die Frage: Lassen sich Schwachstellen finden und nutzen, um eine KI auszutricksen und so beispielsweise der Entdeckung zu entgehen? Damit befassen wir uns in einem Projekt zur Tarnung und Tarnbewertung. Oder die Frage, was passiert, wenn die Input-Daten sich systematisch verschieben, etwa weil der Sensor altert: Ist das Verfahren auch dann noch robust? Um solche Fragen zu adressieren und die Verfahren gezielt zu härten, untersuchen wir auch verschiedene Werkzeuge, die den einen oder anderen Blick in die Black Box ermöglichen können.

 

Welche Ansätze gibt es, um für ausreichende Trainingsdaten zu sorgen?

Arens: In unserem Geschäftsfeld stehen wir vor der Herausforderung, dass Trainingsdaten in der Regel Mangelware sind. Sie fallen nicht im Alltag massenweise an, wie für manche anderen Anwendungsfelder. Das gilt besonders für Multispektraldaten, die im Kontext der Verteidigungsforschung eine wichtige Rolle spielen. Helfen können etwa in Simulationen erzeugte Daten, künstliche Variationen realer Daten oder deren Transformation. So lassen sich aus herkömmlichen Bildern im sichtbaren Spektrum beispielsweise Infrarotdaten generieren, allerdings braucht es dafür wiederum ein eigenes KI-Verfahren. Für all diese Ansätze erforschen und entwickeln wir Werkzeuge.

 

Der Informatiker Dr. Michael Arens ist Sprecher des Geschäftsfelds Verteidigung.und Leiter der Abteilung Objekterkennung (OBJ).

Bewertung signaturverändernder Maßnahmen

Sie wollen mehr zu praktischen Anwendungen von KI-Verfahren erfahren? Dann besuchen Sie unsere Projektseite zur KI-basierten Tarnbewertung und informieren Sie sich.

 

Verteidigung

Erfahren Sie hier mehr über die Anwendungsfelder und Technologien unseres Geschäftsfelds Verteidigung.