Audio-Mining-System für die ARD

Vollautomatische Erschließung der ARD-Archive

Wir helfen Journalist*innen und Redakteur*innen, in den Archiven der ARD schnell die Information zu finden, die sie gerade benötigen. Dazu setzen wir ein speziell für die ARD entwickeltes Audio-Mining-System ein, das die Beiträge erschließt: Vorhandene Metadaten werden um das Transkript der gesprochenen Sprache sowie eine Segmentierung der Sendung in einzelne Sprecher*innen ergänzt. Zusätzlich werden automatisch die für einen Beitrag wesentlichen Schlagworte ermittelt.

Die ARD, der Verbund aus neun Landesrundfunkanstalten sowie dem Auslandsnachrichtensender Deutsche Welle, besitzt ein riesiges Archiv von produzierten Beiträgen, die bis in die Anfänge der Bundesrepublik sowie der DDR zurückreichen und mittlerweile zum großen Teil digitalisiert vorliegen.

Zu jedem Beitrag gibt es bereits manuell annotierte Metadaten wie beispielsweise der Titel, die Sendereihe, aber auch Kurzbeschreibungen. Durch unsere vollautomatische Erschließung des gesprochenen Textes und die Integration in die bestehenden Rundfunk- und Fernseh-Archivsysteme der Anstalten können Beiträge in Sekundenschnelle durchsucht und relevante Stellen direkt gefunden werden.

Umsetzung

Das Fraunhofer IAIS arbeitet schon seit 2015 gemeinsam mit dem WDR an der praktischen Nutzung des Audio-Mining-Systems. Das System wird im Rechenzentrum der ARD betrieben und ist an die Archivsysteme der einzelnen Rundfunkanstalten angeschlossen. Es läuft auf einem Verarbeitungscluster, um eine schnelle Verfügbarkeit der Ergebnisse – auch zu Zeiten von Verarbeitungsspitzen – zu erreichen und ist derzeit auf eine Verarbeitung von bis zu 2000 Stunden Audio- und Videomaterial pro Tag ausgelegt.

Neu veröffentlichte Beiträge werden vollautomatisiert bearbeitet: Dabei kommen insbesondere die Spracherkennung und eine darauf aufbauende Schlüsselwort-Extraktion zum Einsatz. Eine Sprechererkennung zum Auffinden von Originalzitaten von Personen des öffentlichen Lebens, zum Beispiel Politiker*innen, ist in der Pilotphase.

Kundenspezifische Anpassungen

Neben der Unterstützung beim Betrieb des bestehenden Systems entwickelt das Fraunhofer IAIS das System insbesondere für die Bedürfnisse von Journalist*innen, Redakteur*innen und Rechercheur*innen der ARD weiter. Da im Nachrichtenbereich ständig neue Begriffe und Eigennamen auftreten können, haben wir ein selbstlernendes Spracherkennungssystem entwickelt, welches neue Wörter durch tägliche Aktualisierung des Modells hinzufügen kann. Auch kundenspezifische Modelle, die etwa auf regionale Begriffe oder bestimmte Themen hin optimiert werden, wurden erstellt. Im Rahmen eines Weiterentwicklungsprojektes implementieren wir weitere vom Kunden gewünschte Features, wie etwa die Verbesserung der Erkennung ausländischer Namen oder die korrekte Formatierung von Zahlen und Daten.

Nutzen für den Kunden

Unser Audio-Mining-System erschließt die Inhalte von Archiven, sodass Redakteur*innen relevante Informationen schnell finden können. In den ARD-Archivsystemen können so gezielt Beiträge zu bestimmten Themenbereichen oder Stichwörtern gefunden werden. Innerhalb eines Beitrags kann die exakte Stelle, an der ein Begriff benutzt wurde, angesprungen werden. In Kombination mit der Sprechererkennung werden sogar Originalzitate von Personen auffindbar.