Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung IOSB
Institutsteil Industrielle Automation

Analyse großer Datenmengen in Verarbeitungsprozessen

 

Willkommen auf der Webpräsenz des BMBF-Projekts AGATA - ein Verbundprojekt im Rahmen der Bekanntmachung "Management und Analyse großer Datenmengen (Big Data)"

                                                                  

 

Förderkennzeichen 01IS4008 A-F

 

Erwartetet Ergebnisse

In dem Projekt soll ein selbstlernendes Assistenzsystem entwickelt werden, das durch die Beobachtung komplexer Verarbeitungsprozesse in Industrie und Landwirtschaft Zusammenhänge ermittelt und so Fehler, Anomalien und Optimierungsbedarf automatisch erkennt. Zu diesem Zweck sollen die im Folgenden beschriebenen Teilvorhaben realisiert werden.

IOSB:

Das Fraunhofer IOSB entwickelt in diesem Vorhaben modellbasierter Verfahren zur Überwachung komplexer Verarbeitungsprozesse in Industrie und Landwirtschaft. Die Schwerpunkte sollen dabei auf die Entwicklung automatischer Verfahren zum Lernen komplexer Prozessmodelle und auf Verfahren zur modellbasierten Anomalieerkennung gelegt werden. Solche Verfahren wurden am Fraunhofer IOSB bereits erprobt und sollen in diesem Projekt für die Verarbeitung großer Datenmengen in komplexen Verarbeitungsprozessen weiterentwickelt werden. Darüber hinaus soll das IOSB an der Entwicklung von Methoden zur Erfassung großer Datenmengen in heterogenen Netzwerken mitwirken. Die entwickelten Verfahren sollen in der zweiten Hälfte der Projektlaufzeit in verschiedenen industriellen und landwirtschaftlichen Anwendungen erprobt werden.

DFKI:

Das DFKI entwickelt Verfahren zur Erkennung von Anomalien auf Rohdaten ohne dass detailliertes Prozess- oder Modellwissen zugrunde liegt. Dabei werden Strukturen und Zusammenhänge von Merkmalen auf Ausreißer hin untersucht und die wesentlich beitragenden Merkmale gefunden. Im DFKI entwickelte Verfahren haben bereits in der Vergangenheit Unstimmigkeiten und Ausreißer aufgedeckt, über deren Existenz und Ausmaße man sich vorher nie bewusst war. Auch Ursachen erkannter Fehler oder besonderer Vorkommnisse können so gefunden werden. Die Algorithmen sollen an die Verarbeitung großer Datenmengen angepasst werden und stehen für Praxistests bei landwirtschaftlichen Anwendungen und zur Prozessanalyse zur Verfügung.

Hilscher:

Als Grundlage für die im Vorhaben durch die Projektpartner entwickelten modellbasierten Verfahren zur Überwachung komplexer Verarbeitungsprozesse muss eine hochgenaue Erfassung der Prozessrohdaten, also z.B. Stellgrößen und Messwerte, erfolgen. Hilscher wird hierzu die notwendige Technologie entwickeln, die es ermöglicht diese Daten hochgenau und über den gesamten Produktionsstandort verteilt zu erfassen. Die entwickelten Datenerfassungspunkte sollen in der zweiten Hälfte der Projektlaufzeit in verschiedenen industriellen und landwirtschaftlichen Anwendungen erprobt werden.

BTS:

Vor dem Hintergrund einer zunehmend heterogenen Systemlandschaft sowie des ständig steigenden Automatisierungsgrades von Anlagen gewinnen innovative Assistenzsysteme und Plant Asset Management (PAM) Lösungen für den Operator immer mehr an Bedeutung. Dabei kommt der Überwachung und Diagnose von Apparaten, Geräten und Automatisierungstechnik eine Schlüsselrolle zu. Für die Überwachung und Diagnose bereits einfacher Apparatecluster und ganzer Teilanlagen stehen zur Prozessführung bereits standardmäßig eine Vielzahl von Informationen, wie Mess- und Stellgrößen, zur Verfügung. In der Vergangenheit hatten die Anwender allerdings keine Möglichkeit, die Informationen in vollem Umfang zu nutzen. Die Bayer Technology Services (BTS) hat in Zusammenarbeit mit dem IOSB bereits erste Schritte unternommen, um diese Informationen in Form von datengetriebenen Prozessmodellen für ein integriertes Plant Asset Monitoring nutzbar zu machen. Im Rahmen des Projektes sollen die begonnenen Schritte nun konsequent weiterentwickelt werden.

CLAAS:

CLAAS-Landmaschinen sind an telematische Systeme des Herstellers angebunden, um auf Basis erfasster und aufbereiteter Prozessdaten die Produktivität und Instandhaltung zu verbessern. Zur Verringerung der Lücke zwischen installierter und realisierter Leistung soll auf der Grundlage der bestehenden Telematik-Lösung (CLAAS-Telematics) die Fähigkeit zur Analyse der Daten durch Einführung und Anwendung von Data-Mining-Methoden verbessert werden. CLAAS-Telematics wird entsprechend den Bedürfnissen der Analysewerkzeuge angepasst und eine Schnittstelle entwickelt, über die Analysewerkzeuge auf den Datenbestand zugreifen können. CLAAS implementiert ein Assistenzsystem zur Darstellung von Analyseergebnissen. Das betrifft einerseits eine Anwendung für Prozessverantwortliche (hoher Detailgrad), andererseits eine Anwendung für Maschinenbediener (mit reduziertem Detailgrad) zur Nutzung auf den mobilen Arbeitsmaschinen. Für die praktische Erprobung werden mehrere Kundenbetriebe ausgewählt, die Maschinen den Projektanforderungen entsprechend konfiguriert, die Prozessdaten erfasst und mit den entwickelten Methoden ausgewertet. Die Erprobung erfolgt am Beispiel von Mähdreschern in der Getreideernte, weil diese Maschinen durch höchste Komplexität, größte Datenmenge und höchste Nutzerzahl im Telematik-System gekennzeichnet sind.

Tönsmeier:

Für die Geschäftsbereiche Umweltdienstleistungen und Abfallaufbereitung betreibt Tönsmeier verschiedene großtechnische Sortieranlagen für die Rückgewinnung von Wertstoffen aus Abfällen. Es ist bekannt, dass die heutigen und zukünftigen Abfallströme sich in ihrer heterogenen Zusammensetzung, ihrer Korngrößenverteilung sowie in ihren Störstoffanteilen ständig verändern, so dass einer laufenden Prozesskontrolle im Sortierprozess selber einer besonderen Bedeutung zukommen wird. Derartige Änderungen, die zu Prozessanomalien führen können, sollen unter Einbeziehung der bereits vorliegenden Sensordaten sowie zusätzlicher Sensorik, frühzeitig erkannt werden. Im Ergebnis des Projekts soll ein Ampelsystem geschaffen werden, welches Grundlage für weitere Forschungen im Bereich der Automation und Schaffung optimaler Steuerungs- und Reglungsprozesse mit dem Ziel der Erhöhung von Recyclingquoten ist.

Projektinhalte

In industriellen und landwirtschaftlichen Verarbeitungsprozessen fallen immer größere Datenmengen an, so dass die Produkte und damit die Verarbeitungssysteme immer komplexer werden. Die Menge der gespeicherten Daten ist in der verarbeitenden Industrie inzwischen größer als in jedem anderen Sektor – so wurden alleine 2010 fast zwei Exabytes neuer Daten gespeichert. Hinzu kommen riesige Datenmengen (Sensordaten), die zwar erfasst aber aus Effizienzgründen nicht gespeichert werden. Daneben führen steigende Anforderungen an Verarbeitungssysteme, die fortschreitende Integration klassischer Informations- und Kommunikationstechnologie und die Entstehung eines „Internets der Dinge“ zu immer leistungsfähigeren Automatisierungssystemen. Diese Entwicklungen haben zur Folge, dass immer mehr Daten in verschiedenen Subsystemen und Hierarchieebenen wie z.B. verschiedenen Netzwerken, MES (Manufacturing Execution System), SCADA (Supervisory Control and Data Acquisition) Systemen oder ERP (Enterprise Resource Planning) Systemen anfallen.

 

Die zunehmende Komplexität von Verarbeitungsprozessen und des ständig wachsenden Datenaufkommens führt zu einer Überlastung des Anwenders bei der Überwachung, Analyse und Diagnose solcher Prozesse. In vielen Fällen sind die Anwender auch nicht ausreichend geschult, um die komplexen industriellen Prozesse zu überblicken, die Komponenten aus unterschiedlichen Disziplinen wie Informatik, Automatisierungstechnik, Robotik und Maschinenbau enthalten. Aus diesen Gründen werden Probleme und Fehler oft zu spät erkannt, Wartungsintervalle zu kurz gewählt und Optimierungspotential für einen höheren Durchsatz und eine höhere Energieeffizienz nicht ausreichend genutzt.

 

Konkret ergeben sich aus Sicht der Industrie folgende Probleme bei der Datenerfassung, Prozessüberwachung, Fehlererkennung und Analyse der Fehlerursachen:

 

• Daten werden, soweit sie überhaupt gespeichert werden, in industriellen und landwirtschaftlichen Anwendungen meist verteilt, ohne gemeinsamen Zeitbezug und ohne eine Definition der Datenbedeutung bzw. der Semantik abgelegt.

 

• Aufgrund der Menge der anfallenden Daten ist eine manuelle Analyse, z.B. durch die Anzeige aller Zeitverläufe, in der Regel nicht praktikabel, selbst wenn die Daten zusammengefasst, zeitsynchronisiert und semantikbehaftet sind. In industriellen Anwendungen reichen oft schon 5-6 Prozessgrößen, um einen Menschen bei der Analyse der zugehörigen Zeitverläufe zu überfordern. Dies liegt daran, dass die dahinter stehenden physikalischen Prozesse eine hohe Anzahl von gegenseitigen kausalen und zeitlichen Abhängigkeiten haben. In diesem Sinn kann in industriellen Anwendungen oft schon bei einigen hunderten oder tausenden von Prozessgrößen von „Big Data“ gesprochen werden. Erschwerend kommt hinzu, dass die Analyse in Echtzeit erfolgen muss, da die verspätete Detektion von Anomalien hohe Kosten durch Stillstandzeiten oder Verarbeitungsfehler verursachen kann.

 

Als Lösung soll in diesem Projekt ein intelligentes Assistenzsystem entwickelt werden, das die Systemkomplexität für den Anwender transparent macht und dem Anwender eine abstrakte Sicht auf den aktuellen Systemzustand und mögliche Anomalien präsentiert.

 

            a)                                      b)                                        c)

Abbildung 1: Intelligente Assistenzsysteme als Lösung bei großer Systemkomplexität

 

Die Kernidee ist in Abbildung 1 dargestellt: Eine zunehmende Komplexität des Verarbei-tungsprozesses (Abbildung 1a) wird durch zunehmende Fähigkeiten des Assistenzsys-tems bei der Prozessanalyse kompensiert. Das Assistenzsystem soll automatisch die komplexen Prozessdaten (Abbildung 1b) analysieren und dem Anwender abstrakte In-formationen über den Verarbeitungsprozess und mögliche Anomalien liefern, so dass die Prozessanalyse für ihn erheblich vereinfacht wird. Es soll den Anwender dadurch in die Lage versetzen, Anomalien frühzeitig zu erkennen (Abbildung 1c), so dass Anlagen-stillstände und Produktionskosten deutlich reduziert werden. Weiterhin erlaubt eine ver-besserte Anomalieerkennung eine Anpassung der Wartungsintervalle und somit eine Reduktion der Wartungskosten. Darüber hinaus sollen im Fehlerfall auch Fehlerursachen detektiert werden, um eine schnelle Fehlerbehebung zu ermöglichen und damit Stillstand- und Reparaturkosten zu minimieren.

 

Es sollen Verfahren zur Analyse der verfügbaren Informationen entwickelt werden, die Anomalien und Fehlerursachen automatisch erkennen, mögliche Fehlerursachen analy-sieren und die Informationen für den Anwender aufbereiten. Das entwickelte Assistenz-system soll die heterogenen Informationen hinter einer einheitlichen Benutzerschnittstelle verbergen und flexibel in heterogene Verarbeitungsprozesse integriert werden können. Dazu sollen ein geeigneter Datenerfassungsansatz und Methoden zur Prozess-überwachung, die durch Lernverfahren flexibel an veränderte Prozessabläufe angepasst werden können, entwickelt werden. Eine solche Lösung kann einfach in bestehende Verarbeitungssysteme integriert werden, da nur noch wenig Wissen (zumeist Strukturwissen über die Anlage) über ein manuelles Engineering bzw. einen Datenimport einge-pflegt werden muss.

Projektpartner

Projektpartner

 

Projektpartner aus der Industrie:

• Bayer Technology Services GmbH, Leverkusen

• CLAAS Selbstfahrende Erntemaschinen, Harsewinkel

• Hilscher Gesellschaft für Systemautomation mbH, Hattersheim

• Tönsmeier Dienstleistungs GmbH & Co. KG, Porta Westfalica

Projektpartner aus Forschung und Entwicklung:

• Fraunhofer IOSB-INA, Lemgo (Projektkoordination)

• Fraunhofer IOSB, Karlsruhe

• DFKI GmbH, Kaiserslautern

Projektziele

In dem Projekt sollen ein Lösungskonzept und ein Prototyp für ein intelligentes Assistenzsystem zur Analyse großer Datenmengen entwickelt werden. 

 

 Abbildung 2: Wissenschaftliche und Technische Arbeitsziele des Vorhabens

Aus Anwendersicht stellt sich die Lösung wie in Abbildung 2 skizziert dar:

Ein intelligentes Assistenzsystem analysiert kontinuierlich alle Daten des Verarbeitungsprozesses (Sensor- und Aktuatorsignale, MES, ERP, Energiedaten). Falls eine Anomalie erkannt wird, wird das Anlagenpersonal benachrichtigt. Die Mensch-Maschine-Schnittstelle soll das Systemverhalten und erkannte Anomalien sowie Hinweise auf mögliche Ursachen einfach und verständlich für den Anwender darstellen. Typische Anomalien können z.B. defekte Sensoren, Abnutzungserscheinungen bei Komponenten wie Antrieben oder Ventilen, hohe Energieverbräuche, zu hohe Blindleistungsanteile in Energienetzen, defekte Maschine oder eine schlechte Prozessauslastung sein.

Aus technischer Sicht sind somit folgende Ziele zu erfüllen:

• Prozessdatenerfassung in komplexen industriellen Verarbeitungsprozessen

• Prozessüberwachung des gesamten Verarbeitungsprozesses unter Nutzung eines systemweiten Ansatzes zur Anomalieerkennung

• Frühzeitige Erkennung von Fehlern und Abnutzung von Maschinen (Condition Monitoring)

• Erkennung ungünstiger Energieverbräuche, Reduktion der Energiekosten

• Analyse möglicher Fehlerursachen

• Visualisierung der Prozessabläufe und Anomalien.

Dabei sind folgende wissenschaftlichen Fragestellungen zu lösen:

• Erstellung von Datenerfassungsansätzen für komplexe, verteilte Automatisierungssysteme einschließlich der Zeitsynchronisation der Messungen. Dies umfasst die Spezifikation eines geeigneten Informationsmodells für den branchenübergreifenden Einsatz der entwickelten Analyseverfahren und die Entwicklung eines geeigneten Ansatzes zur Integration großer Datenmengen aus vielen heterogenen Quellen.

• Entwicklung von Algorithmen zur Anomalieerkennung und Diagnose während des Prozessablaufs. Die in dem beantragten Projekt entwickelten Lösungen sollen mit geringem Konfigurationsaufwand in verschiedenen Branchen eingesetzt werden. Dafür gibt es zwar algorithmische Lösungsansätze (vgl. Abschnitt I.4). Diese haben aber bislang keine Verbreitung in der industriellen Praxis gefunden, weil sie für die Verarbeitung der dort anfallenden großen Datenmengen noch ungeeignet sind. Daher sollen in diesem Projekt existierende Ansätze zur Anomalieerkennung für den Einsatz in komplexen industriellen Anwendungen weiterentwickelt werden. Prinzipiell existieren zwei Ansätze zur Anomalieerkennung, die in diesem Projekt in zwei verschiedenen Arbeitspaketen weiterentwickelt werden sollen (vgl. Abschnitt II.1 für eine detaillierte Darstellung des Stands der Technik):

 

1. In phänomenologischen Ansätzen werden die aus der Datenerfassung resultierenden Rohdaten direkt als korrekt oder fehlerhaft klassifiziert.

 

2. In modellbasierten Ansätzen werden Modelle verwendet, um das Normalverhalten der Verarbeitungsprozesse zu simulieren. Für die Vorhersage benötigt das Modell alle Eingangsdaten des Verarbeitungsprozesses, z.B. Produktinformationen, Anlagenkonfigurationen, Anlagenzustände, usw. Falls die aktuellen Messungen signifikant, von den Simulationsergebnissen abweichen, wird das Prozessverhalten als potentielle Anomalie klassifiziert.

 

Die Implementierung soll in folgenden Anwendungsszenarien bei den Projektpartnern BTS, CLAAS und Tönsmeier erprobt werden:

 

• Destillationskolonne des Unternehmens Bayer: Die Produktionsprozesse in Destillationskolonnen sind typisch für die chemische Industrie. Sie sind gekennzeichnet durch eine große Anzahl an Systemzuständen und Stellgrößen, zwischen denen komplexe physikalische Zusammenhänge bestehen. Für das wirtschaftliche Betreiben solcher Anlagen sind die Überprüfung der korrekten Funktionalität, die Fehlersuche, das frühzeitige Erkennen drohender Komponentenausfälle und eine konsequente Prozessüberwachung von entscheidender Bedeutung.

 

• Mobile landwirtschaftliche Arbeitsmaschinen des Unternehmens CLAAS: Das Unternehmen CLAAS verfügt über eine Telematik-Plattform, an die momentan weltweit ca. 2000 landwirtschaftliche Maschinen angebunden sind. Die Auswertung dieser Daten erfolgt aktuell mit einfachen statistischen und geostatischen Verfahren. CLAAS möchte das Telematiksystem mit Technologien des Data-Minings dahingehend weiter entwickeln, dass der Maschineneinsatz auf ein höheres Produktionsniveau gebracht werden kann. Dazu sollen die einzelnen Maschinen überwacht werden und abweichende Leistungen sowie Ursachen für diese Anomalien erkannt werden.

 

• Großtechnische Aufbereitungsanlagen des Unternehmens Tönsmeier: In der Leichtverpackungs-Sortieranlage in Porta Westfalica, werden Sekundärrohstoffen aus Sammlungen des Dualen Systems Deutschland gewonnen. Für eine optimale Prozessführung und Steuerung der Anlagen hinsichtlich der Qualität der gewonnenen Rohstoffe und des Energieverbrauchs sowie die Reduzierung von Stillstandzeiten ist es entscheidend, dass Anomalien in der Automation umgehend detektiert und behoben werden.

 

Diese Anwendungsszenarien decken ein weites Anwendungsspektrum in Landwirtschaft, chemisch-pharmazeutischer Industrie und Ressourcenwirtschaft ab.

Veranstaltungen

07. Mai 2015      „Big Data: Gemeinsam die Herausforderungen angehen“ - Fachtagung des BMBF

 

21. Mai 2015      Gesamtprojekttreffen in Porta Westfalica