Audio Mining

Audiovisuelle Analysetools für Redaktionsarchive und die Medienbeobachtung

Mit unserem Audio-Mining-System finden Journalisten und Medienbeobachter zeitgenau Zitate, Stichworte und Themen in audiovisuellen Inhalten. Sie bedienen das System wie eine herkömmliche Suchmaschine. Audio Mining führt immer direkt an die Stelle, an der der Suchbegriff gesprochen wurde.

Dies ermöglicht unsere Spracherkennung, die automatisch das gesprochene Wort in Text überführt. Dabei werden nicht nur die einzelnen Wörter selbst, sondern auch die Zeitinformationen zu jedem Wort erfasst. Zusätzlich zur Sprache wird die Struktur des Audiosignals analysiert. Geräusche, Musik und einzelne Sprecher werden voneinander unterschieden. Diese Daten erleichtern den Zugang zum Medium, man springt von Segment zu Segment.

© Foto Fraunhofer IAIS

Segmentierung einer Audiodatei mit verschiedenen Sprechern (farbig markiert) und Worttreffern (Dreiecke)

Anwendungsgebiete

Für die Medienbeobachtung analysiert das Audio-Mining-System Rundfunkprogramme schon während ihrer Aufzeichnung mit nur geringer Zeitverzögerung und untersucht sie automatisch nach Schlüsselbegriffen. Dadurch werden große Datenmengen für die manuelle Nachbearbeitung bereits effizient vorgefiltert.

Im Redaktions- oder Medienarchiv kann Audio Mining zum einen Erschließungsvorgänge beschleunigen, indem es das Material bereits an charakteristischen Grenzen autonom vorsegmentiert. Zum anderen bietet die Spracherkennung einen völlig neuen Zugang zum archivierten Material. Audio Mining verarbeitet neu eintreffende Inhalte automatisch, die Audio-Suche steht den Nutzern zeitnah zur Verfügung.