AudioMining WDR/DW-Prototyp

Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS

AudioMining - Forschungsprojekt zur automatischen Erschließung von Radioarchiven in Zusammenarbeit mit WDR und Deutsche Welle

Der Westdeutsche Rundfunk und die Deutsche Welle betreiben Audioarchive, in denen Hörfunksendungen und andere Wort- und Musikaufnahmen zum Zweck der Produktionsunterstützung, der Wiederverwendung und des Nachweises der eigenen Programmhistorie archiviert und dokumentarisch beschrieben werden.

Die Produktionsweise des digitalen Funkhauses hat Archiv und Dokumentation neue Möglichkeiten eröffnet und sie gleichzeitig vor neue Herausforderungen gestellt. Die Vereinfachungen im handwerklichen Umgang mit Audiomaterial, die sie mit sich bringt, erleichtern die Nutzung bereits vorhandenen Materials als Rohstoff wesentlich. Allerdings setzt diese voraus, dass auf das Archivmaterial während der Produktion schnell, flexibel und präzise zugegriffen werden kann.

Dies erfordert zunächst seine technische Verknüpfung mit den Metadaten der Referenzdatenbank. Darüber hinaus ist jedoch eine Erweiterung der inhaltsgerichteten Zugriffswege erforderlich. Die dokumentarische Beschreibung einer Sendung bildet deren Struktureinheiten ab, sie referiert auswählend und gewichtend ihren Inhalt, und sie bedient sich hierzu einer vereinheitlichten Sprache, die den gleichen Sachverhalt in allen Zusammenhängen gleich benennt. Sie ermöglicht eine rasche Orientierung in großen Dokumentmengen und präzise und vollständige Rechercheergebnisse. Sie basiert jedoch auf einem reinen Metadaten-Ansatz. Im Printbereich wird sie ergänzt und ergänzt ihrerseits die Recherche in den Daten selbst, im Volltext.

Ein solcher Zugriff auf die Essenz existiert im Audiobereich bislang nicht. Für die Materialsichtung bedeutet dies, dass unterhalb der Sequenz-Ebene oder unter einer nicht durch die Metadaten antizipierten Fragestellung lediglich ein Abhören in Echtzeit oder ein tentatives Überspringen einzelner Abschnitte möglich ist, da es naturgemäß keine Entsprechung zum Querlesen des Textbereichs gibt.

Des Weiteren steht das Archiv des digitalen Funkhauses vor einem Problem der Mengenbewältigung und des Versionsmanagements digitaler Produktionen, das sich ohne technische Unterstützung und automatische Analyseverfahren mit den vorhandenen Personalressourcen nicht wird lösen lassen.

Ziel

Das Projekt AudioMining soll ein prototypisches System zur teilautomatisierten Erschließung digital vorliegender Hörfunkproduktionen schaffen. Zu den Hauptfunktionen dieses Systems wird es gehören, Struktureinheiten einer Produktion zu erkennen und ihren Wortanteil der textbasierten Recherche zugänglich zu machen.

Es soll hierdurch zum einen dem dokumentarischen Bearbeiter eine Arbeitsgrundlage liefern, die ihn darin unterstützt, zu hochwertigen Produktionen hochwertige Metadaten in der erforderlichen Granularität zu produzieren. Zum anderen soll es bislang aus Kapazitätsgründen lediglich formal erfasste Beiträge auch ohne weitere Bearbeitung durch die Dokumentation Wort für die inhaltsbezogene Recherche nutzbar machen.

Realisierung

Die Realisierung der Analysekomponenten erfolgte auf Basis des Medienanalysesystems iFinder des Fraunhofer IAIS.

Weiterentwicklung

Aus der prototypischen Implementierung, die die Machbarkeit und den sinnvollen Einsatz von Audioanalyse-Verfahren im Rundfunkarchiv belegt hat, ist das AudioMining-System entstanden.