Smart Semantics

Bislang war es sehr aufwändig, Anwendungen zur Analyse unstrukturierter Textdaten zu entwickeln. Am Fraunhofer IAIS haben wir daher frühzeitig begonnen, innovative Analyseverfahren aus der angewandten Forschung in Module zu überführen, die sich leicht in bestehende IT-Systeme integrieren lassen. Diese Module nennen wir Smart Semantics.

Anwendungen

Wir haben Smart Semantics Komponenten in vielen Kunden- und Entwicklungsprojekten angewandt. Einige Anwendungsmöglichkeiten sind:

Meinungs- und Marktforschung

  • Emotionen zu Produkten oder Marken erhalten (Online EmotionsRadar)
  • Hervorgehobene Produkt-Aspekte aus Kundenfeedback extrahieren (Eat+Drink)
  • Zitate von Personen feststellen und thematisch zuordnen (Quote)

Enterprise Content Management

  • Online-Werbeumfelder auf Unbedenklichkeit testen (IASH.EU)
  • Fachdaten aus Inbound Dokumenten extrahieren
  • Dokumente mit bestimmten Inhalten schneller finden
  • Unternehmensverzeichnisse automatisch aktualisieren

Knowledge Management

  • Zusammenarbeit zwischen Firmen aus Pressemeldungen feststellen
  • Kompetenzen von Personen aus Publikationen identifizieren
  • Kundenmeinungen auf Schwerpunkte analysieren

Smart Semantics Komponenten

Smart Semantics sind in den Programmiersprachen C++ und Java geschrieben und lassen sie sich einfach in bereits bestehende IT-Umgebungen integrieren. Folgende Komponenten bieten wir Ihnen zur Nutzung an:

 

Smart Semantic Site-Classifier

Der Site-Classifier erlaubt die maschinelle Klassifikation ganzer Dokumente wie z.B. Webseiten. Nach einer Trainingsphase sind auf diese Weise z.B. Projekt-, Mitarbeiter- oder Produktseiten automatisch als solche erkennbar und für die effizientere Suche nutzbar (z.B. „Zeige alle Seiten, die den Begriff X enthalten und als Produktseite klassifiziert wurden“).

Smart Semantic Named-Entity-Recognizer

Der Named-Entity-Recognizer identifiziert benannte Entitäten wie Personen, Organisationen, Orte und ermöglicht dadurch die Filterung von Dokumenten nach bestimmten Entitäten (z.B. „Zeige alle Seiten, die X und zusätzlich Personennamen enthalten“).

Smart Semantic Clusterer

Der Clusterer ist eine Komponente, die das Wortaufkommen in Dokumenten ermittelt und auf dieser Basis die statistische Ähnlichkeit von Dokumenten untereinander berechnet. Hilfreich ist diese Komponente z.B. bei der Vermeidung von Duplikaten.

Smart Semantic Keyword-Extractor

Der Keyword-Extractor ist eine Komponente, die statistisch signifikante Wörter aus Dokumenten extrahiert und diese z.B. für Tagclouds, für Wortvorschläge bei Suchanfragen oder als Zusatzinformationen in der Suchergebnisdarstellung bereitstellt.

Smart Semantic Topic Modeler

Der Topic Modeler ist eine Komponente, die statistisch signifikante Topics (in etwa Themen) auf Dokumentbeständen berechnet. Diese Komponente ist sehr hilfreich, um eine Benennung von Gruppen ähnlicher Dokumente oder die Kontextualisierung von Einzeldokumenten zu berechnen.