Knowledge Technologies

Wir forschen an der automatisierten Erzeugung von Wissensgraphen und der Integration von Wissen aus heterogenen Quellen. Wissensgraphen strukturieren Daten und Wissen, ermöglichen eine semantische Verknüpfung und sind in vielen Fällen die Basis dafür, dass Anwendungen der Künstlichen Intelligenz (KI) erklärbar werden und für den Menschen nachvollziehbare Ergebnisse liefern.

Im Zuge der Digitalisierung verdoppelt sich alle zwei Jahre die Menge aller weltweit verfügbaren Daten – und diese Daten werden immer diverser. Darum geht der Trend zu Wissensgraphen, welche unterschiedliche Datenquellen integrieren. Sie bilden die technologische Grundlage, ohne die viele KI-Anwendungen und -Assistenten nicht funktionieren würden: Wissensgraphen stecken in Lösungen zum Auffinden von Informationen (Information Retrieval) sowie in Frage-und-Antwort-Systemen (Question Answering), welche beispielsweise in Chatbots zum Einsatz kommen.

Zur automatisierten Erzeugung globaler Wissensgraphen bauen wir auf einheitliche Vokabulare und Standards bezüglich Datenformaten, insbesondere aus dem Bereich Linked Open Data (W3C und Resource Description Framework, RDF). Zusammen mit der Universität Bonn haben wir Open-Source-Techniken zur Erzeugung und Abfrage großer Wissensgraphen entwickelt. Wir tragen außerdem zu vielen – teilweise frei verfügbaren – Wissensgraphen bei, zum Beispiel dem DBpedia-Wissensgraph, welcher aus Wikipedia extrahiert wurde.

Zu unseren Publikationen und Studien

Forschungsschwerpunkte

Unsere Forschung dient dazu, Terminologien, Normen und domänenspezifisches Expertenwissen aus unterschiedlichen Bereichen auf standardisierte Vokabulare abzubilden. So können wir Datenbestände automatisiert mit externen Quellen semantisch verknüpfen. Die resultierenden Wissensgraphen können beispielsweise das Wissen in einem Unternehmen abbilden. Damit lassen sich Anwendungen zum Auffinden von Informationen gestalten oder Dialogsysteme aufbauen, die mit unternehmensspezifischem Wissen trainiert wurden.

Knowledge Graph Embeddings

Über Embeddings können Wissensgraphen in KI-Architekturen (zum Beispiel tiefe neuronale Netze) integriert werden. Dies eröffnet eine breite Palette neuer Anwendungen, zum Beispiel der Vorhersage von bisher unbekannt Fakten anhand existierender verwandter Fakten.

Automatisierte Konstruktion von Wissensgraphen

Wir forschen daran, alle Schritte des Aufbaus und der Erweiterung von Wissensgraphen weitgehend zu automatisieren. Zum Beispiel können wir aus verschiedenen relationalen Datenstrukturen (Datenbanken, Spreadsheets usw.), aus JSON, XML-Dateien, sowie teilweise aus Textquellen Wissensgraphen extrahieren.

Enterprise Data Integration

Zum Aufbau von Unternehmens-Wissensgraphen integrieren wir Daten und Wissen aus heterogenen, verteilten Quellen. Die Basis für diese Integration bilden standardisierte Vokabulare.

Highlights

Scalable Semantic Analytics Stack (SANSA Stack)

Zusammen mit der Universität Bonn und weiteren Forschungspartnern haben wir eine Programmbibliothek zur Verarbeitung großer Wissensgraphen entwickelt. Die Anwendung setzt auf hybride KI-Ansätze und verbindet Verfahren des Maschinellen Lernens mit Methoden der semantischen Analyse. Die Open-Source-Software ermöglicht eine hochskalierbare Verarbeitung und Analyse großer Datenmengen.

Technologien für sichere Datenräume

Wir setzen unsere Knowledge Technologies in den Projekten rund um die International Data Spaces ein, die vom BMBF und von der Fraunhofer-Gesellschaft gefördert werden. Dafür haben unsere Wissenschaftler*innen die Referenzarchitektur geschaffen und entwickeln ein Informationsmodell sowie domänenspezifische Vokabulare.

Ausgezeichnete Veröffentlichung: Ten Year Best Paper Award

Die Publikation „DBpedia: A Nucleus for a Web of Open Data“, an der u.a. unser Lead Scientist Prof. Dr. Jens Lehmann mitgearbeitet hat, erhielt 2017 den SWSA Ten-Year Award der Semantic Web Science Association (SWSA). Das Gremium begründete seine Wahl damit, dass das häufig zitierte Paper auch zehn Jahre nach seiner Veröffentlichung den größten Einfluss auf den Bereich Semantic Web und darüber hinaus habe.