Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung IOSB

Informationsmanagement mit Semantischen Modellen

Die Beherrschung einer immer größer werdenden Menge von Informationen, in immer komplexen werdenden Organisationen, ist heute an vielen Stellen ein drängendes Problem. Dies trifft auch für die Bundeswehr zu, und hier in einem vielleicht besonderen Maße in dem Bereich der Studien und Analysen. Dort entstehen im Rahmen von teilweise sehr großen und umfangreichen Projekten wertvolle und oft sehr spezifische Erkenntnisse, die in einem definierten Kontext zu bewerten sind. Diese Erkenntnisse sind in der Regel in meist umfangreichen Berichten dokumentiert. An den zentralen Entscheidungsstellen, bei denen alle Informationen zusammenfließen, kann diese erfreulicherweise große Informationsmenge jedoch schnell zum Problem werden.Um zu diesen umfangreichen Bestand an Ergebnissen und Erkenntnissen einen effizienten und verlässlichen Zugang zu schaffen, wird beim Fraunhofer IOSB ein Informationsmanagementsystem konzipiert, das auf einer semantischen Modellierung der wesentlichen Informationselemente basiert.

 

 

Wissenserschließung

Dabei stellte sich zunächst die Frage, wie der oben skizzierte Informationsbestand erschlossen werden kann. Da der Inhalt häufig in maschinell-verarbeitbaren Dokumenten vorliegt, käme eine automatische Erschließung der Inhalte über die Methoden des „data mining“ oder auch „natural language processing“ (NLP, oder auch natürliche Sprachverarbeitung) in Frage. Diese können jedoch nach heutigem Stand der Technik keine vollständig verlässliche Klassifizierungsaussage liefern und sind daher nur als ergänzende Verfahren zu sehen. Bei dem hier beschriebenen System wurde daher der Weg der expliziten manuellen Klassifikation gewählt.

 

 

Bild 1: Kompetenzfragen, Modellbildung

 

Für diese explizite Klassifikation wird zunächst eine eindeutige Definition der Begrifflichkeiten und Strukturen des Informationsraumes benötigt. Hierzu werden nach der Methode der Kompetenzfragen zunächst die Fragestellungen ermittelt, die für Analyseaufgaben in dem einleitend beschriebenen Kontext beantwortet werden sollen. Bei den Kompetenzfragen handelt es sich um typische Fragen nach Strukturen, Begriffen und Zusammenhängen, wie sie von potentiellen Nutzern des Systems gestellt werden könnten. Diese natürlich-sprachlich formulierten Fragen sind eine sehr geeignete Form, die Anforderungen an ein Informationsmodell in einer Art und Weise zu definieren, die den Anwendern des Systems sehr nahe liegt.

 

Modellbildung

 

Aus diesen Fragestellungen heraus, wird dann das formale Modell des Informationsraums in Form eines semantischen Modells abgeleitet. Diese auch als Ontologie bezeichnete Formalisierung ist dabei nötig, um das Informationsmodell für die Software des Informationssystems interpretierbar zu machen. Eingesetzt wird das Fraunhofer IOSB Produkt WebGenesis, das in der Lage ist, aus einer standardisierten Ontologiebeschreibung ein funktionsfähiges, web-fähiges Informationsmanagementsystem zu generieren.
 

 

Mit diesem Ansatz ist es möglich, den Datenbestand in einen semantischen Kontext zu setzen. Dieser liefert dem Nutzer eine Unterstützung bei der Informationsrecherche, und kann für eine rechnergestützte Aufbereitung und Auswertung der Inhalte genutzt werden.

 

Für die Visualisierung der Ontologie wird hier auf das Ergebnis einer Kooperation mit dem Fraunhofer IGD zurückgegriffen. Dabei wird eine Anbindung der IGD-Visualisierung SemaVis an das ISOB-Informationsmanagementsystem WebGenesis realisiert, mit dessen Hilfe das semantische Netz der WebGenesis-Einträge in einer interaktiven Visualisierung dargestellt werden kann.

 

 

Bild 2: Visualisierung des Informationsraumes

 

Die modellierten semantischen Zusammenhänge werden neben der Visualisierung und Navigation auch für die Formulierung von semantischen Anfragen genutzt. Hierzu werden spezifische Fragestellungen, wie etwa die erfassten Kompetenzfragen, in einer semi-formalen Notation formuliert. Hierzu steht ein Web-basierter graphischer Editor innerhalb von WebGenesis zur Verfügung. Damit können Strukturinformationen abgefragt werden, wie etwa die im Bild 3 gezeigte Frage: „welche Ziele eines Vorhabens beschäftigen sich mit einem bestimmten Fachthema mit dem folgenden Titel?“.

 

 

Bild 3: Semantische Abfrage

 

Am Ende dieses Modellierungsprozesses steht ein Web-basiertes Informationsportal, das die enthaltenen Daten in einen semantischen Kontext setzt, und den Nutzern damit einen fach- und aufgabengerechten Zugang ermöglicht (Bild 4).

 

 

Bild 4: Web-basiertes Informationsportal

 

Das System befindet sich aktuell in einer Evaluierungsphase, bei der die Nutzbarkeit im praktischen Einsatz mit konkreten Aufgabenstellungen untersucht wird. Die bisherigen Erfahrungen sehen sehr vielversprechend aus.
Die beschriebenen Arbeiten werden gefördert vom Bundesministerium für Verteidigung (Zuwendungsnummer CE 41F A 227 X).