IAIS-Cortex

IAIS-Cortex

»Eine Maschine, die Kunst und Kultur in Zahlen verarbeitet«

Vera Münch, in Information,
Wissenschaft & Praxis, 2011

IAIS-Cortex meistert große Datenmengen und knüpft neue Wissensnetze

IAIS-Cortex wurde im Rahmen des Aufbaus der Deutschen Digitalen Bibliothek (DDB) konzipiert und entwickelt und dient als Kernsystem der DDB für die Informationsintegration von Daten des kulturellen und wissenschaftlichen Erbes aus den Kultur- und Wissenschaftseinrichtungen in Deutschland.

Dank der modularen und flexiblen Konstruktion ist das System unabhängig von spezifischen Datenmodellen und -formaten für jedes Anwendungsszenario verwendbar, in dem die Herausforderung in der Aggregation und Vernetzung insbesondere großer und heterogener Datenquellen besteht. Systemintern kann das aggregierte Faktenwissen verknüpft und mittels semantischer Verfahren mit externem Wissen angereichert werden. Hierfür können sowohl linked open data als auch unternehmensspezifische Wissensdatenbanken und Ontologien genutzt werden. Über eine standardisierte Schnittstelle stellt IAIS-Cortex die gewünschten Informationen verschiedensten Endbenutzeranwendungen zur Verfügung, vom Webportal bis hin zur Smartphone App. Ebenfalls ist die Integration von IAIS-Cortex in gegebene Infrastrukturumgebungen möglich.

IAIS-Cortex belegt seine Skalierbarkeit und Zuverlässigkeit im Betrieb der Deutschen Digitalen Bibliothek, die zum Start im Herbst 2012 bereits einen Umfang von über fünf Millionen Objekten umfasste – der Datenbestand wird kontinuierlich ausgebaut.

Features von IAIS-Cortex

Flexible Datenintegration (Ingest)

Ein automatisierter, an das OAIS Referenzmodell angelehnter Prozess organisiert die parallele Integration von Informationen aus zahlreichen Datenquellen. Heterogene Quelldatenformate werden durch individuelle Abbildungen (Mappings) in ein internes Datenmodell überführt und dabei gleichzeitig mit bereits erfasstem Faktenwissen vernetzt sowie semantisch mit externen Ontologien angereichert. Gleichzeitig werden bereits beim Ingest semantische Facetten als Basis für die bei der späteren Suche angebotenen Suchfilter generiert. Das verlustfreie interne Datenmodell bewahrt die semantische Tiefe vielfältiger und unterschiedlicher Metadatenformate – die originalen Liefergegenstände bleiben erhalten und können jederzeit zur Verfügung gestellt werden.

Zuverlässige Datenhaltung (Persistenz)

Die Datenhaltung der aggregierten Informationen (z.B. Erschließungsdaten), zugehöriger Binärdaten (z.B. Multimedia-Dateien) und der Suchindizes (z.B. Solr) erfolgt in IAIS-Cortex über ein flexibles Interface, zum Beispiel per frei skalierbarem Dateisystem, durch ein Datenbank-basiertes System oder in einer Storage Cloud. Damit ist das System besonders gut für große Datenmengen konfigurierbar und für eine besonders hohe Systemzuverlässigkeit mehrfach redundant auslegbar.

Individueller Zugriff (Information Retrieval)

Eine offene Schnittstelle ermöglicht den individuellen Zugriff auf die gespeicherten Daten durch Drittsysteme oder Endnutzeroberflächen wie Webportale oder Smartphone Apps. Die facettierte Suche auf dem Informationsbestand umfasst eine semantische Filterung zur systematischen Eingrenzung von Suchergebnismengen und den Zugriff auf Objekte, Binaries und die originalen Liefergegenstände.

Ausgewählte Publikationen zu IAIS-Cortex

Becker, Sven; Berkler, Katrin; Borowski, Marion:
Ein Datenlogistikzentrum mit enormem Potenzial / IAIS-Cortex meistert große Datenmengen und knüpft neue Wissensnetze

In: BuB - Forum Bibliothek und Information, vol. 03, pp. 213−215, 2012, Fachzeitschrift des BIB. Berufsverband Information Bibliothek e. V.
ISSN 1869-1137 (Print-Ausgabe)
Volltext im BuB-Heftarchiv (PDF, s. S. 213ff)

Borowski, Marion; Stalmann, Kai; Becker, Sven:
Preparing the ground for the german digital library

In: ERCIM News, vol. Special theme: ICT for Cultural Heritage, no. 86, pp. 40–41, July 2011, special theme: ICT for Cultural Heritage
Volltext (extern)

Münch, Vera:
Eine Maschine, die Kunst und Kultur in Zahlen verarbeitet

In: B.I.T.online 15 (2012) Nr.1, pp. 9–12
Volltext (extern)

Münch, Vera:
Herz und Hirn für die Deutsche Digitale Bibliothek

In: Information, Wissenschaft & Praxis 62 (2011) 8, pp. 355–358
Volltext (extern)

Stalmann, Kai; Wegener, Dennis; Doerr, Martin; Hill, Hermann Josef; Friesen, Natalja:
Semantic-based retrieval of cultural heritage multimedia objects

In: International Journal of Semantic Computing Vol. 06, No. 03, pp. 315–327, 2011
Volltext (DOI)