Herrscher über das Chaos Strategien, um im Dokumentenwust den Überblick zu wahren

Hannover, 15.09.2006

Volltextsuchmaschinen sind längst nicht mehr in der Lage, das Informationsbedürfnis angesichts ständig wachsender Datenmengen zu erfüllen. Gerade Unternehmen suchen nach Alternativen und Ergänzungen, um ihre Wissensressourcen effizient zu nutzen. Verschiedene Wissensmanagement-Lösungen erfreuen sich daher wachsender Beliebtheit.

Beziehungskisten
Das Fraunhofer-Institut für Integrierte Publikations- und Informationssysteme (Fraunhofer IPSI) hat mit ConWeaver ein Werkzeug entwickelt, das Informationen automatisch aus Texten extrahiert und in eine Ontologie einfügt. Es vernetzt Informationen zu Projekten, Produkten, Kunden und Fachfragen. Davon profitiert unter anderem das Unternehmen Bilfinger & Berger für sein internationales Wissensmanagement. Nach dem Abschluss eines Projekts verschwindet häufig ein Großteil des dort angehäuften Wissens auf Dateiservern, auf CDs im Regal oder in Papiermappen zwischen zwei Aktenordner gezwängt. Die Ablagestrukturen großer Unternehmen sind selten transparent genug, um die Träger solchen Wissens zu identifizieren.

ConWeaver - semantisches Netz
Das hinter Conweaver steckende semantische Netz
findet von der Altbausanierung über das Projektblatt den passenden Experten.


Ontologien versprechen einen Ausweg aus der Misere. Sie verknüpfen Informationen von ansonsten weit gehend unabhängig arbeitenden Wissensquellen wie einem Dokumentenmanagement- oder Enterprise-Ressource-Planning-System. Wenn „Alfred Neumann“ als Kunde Gegenstand der Suche ist, weiß die Ontologie, dass beim gleichnamigen „Besteller“, „Customer“ und „Vertragnehmer“ die identische Person gemeint ist. Gleichzeitig kann sie den Kunden vom Mitarbeiter Alfred Neumann aus der Buchhaltung abgrenzen. Aus den Daten entstehen durch den Import in eine Ontologie Entitätennetze: „Helmut Scholl“ ist Projektleiter von „Altmühlbrücke“, „Altmühlbrücke“ ist Thema in „Projektblatt B-27/2003“. Damit sich das Gerüst aus Projekten und Personen mit Kompetenzen füllt, die sich später über eine Recherche ermitteln lassen, muss die Ontologie das in Projektblättern und Dossiers gespeicherte Wissen abbilden. Ein Indexierungsmodul nalysiert die Texte nach statistischen und linguistischen Methoden. Es identifiziert zunächst das Vokabular, vor allem Komposita („Autobahnbrücke“) und Mehrwortausdrücke („Brücke über eine Autobahn“). Danach filtert es einerseits aus diesem Vokabular Entitäten heraus und verknüpft sie mit der Ontologie: „Dehnfuge“ ist Unterbegriff von „Fuge“, welches verwandt mit „Verfugung“ ist, welches das Projektblatt B-32/2004 thematisiert. Um die thematische Vernetzung des Vokabulars zu analysieren, zerlegt die Software Komposita und Phrasen mit linguistischen Verfahren und übernimmt die Elemente als Synomyme, Ober-, Unter- und Differenzbegriffe in die Ontologie. Mit statistischen Verfahren ermittelt die Software Begriffspaare mit semantischer Nähe, das heißt Begriffe, die eine ähnliche Bedeutung haben wie „Bauen im Bestand“ und „Sanierung“. Dazu sucht die Software beispielsweise nach Ausdrücken, die in einem 30 Wörter umfassenden Textfenster häufig gemeinsam auftreten. Sie stellt anschließend die Richtung einer solchen Verbindung fest: Taucht das Wort „Bauen im Bestand“ fast immer zusammen mit „Sanierung“ im Text auf, „Sanierung“ aber auch in Verbindung mit vielen anderen Fachvokabeln, so ist das spezielle Thema „Bauen im Bestand“ Teil des allgemeinen Themas „Sanierung“.

Dem Anwender präsentiert sich Conweaver als Suchmaschine mit einem simplen Eingabefeld: „Kunden denken immer ausschließlich vom Interface her. Sie suchen so etwas Einfaches wie Google“, sagt Dr. Thomas Kamps, der die Entwicklung von ConWeaver leitet. Die Bedienoberfläche präsentiert aber nicht nur eine nach Relevanz sortierte Liste von zehn Dokumenten, sondern Einträge in verschiedenen Kategorien wie „Personen“, „Projekte“ und „Fachliteratur“. Neben der Hauptstoßrichtung, die dem Nutzer auf der linken Seite genau verrät, wonach er sucht, erhält er auf der rechten Seite über ähnliche Dinge die Möglichkeit, davon abzuweichen.

[Auszug aus c't 9/2006, S.178 ff (André Kramer)]