Text Analytics

Wissen erschließen mit Techniken des Textverstehens

Menschen, die über soziale Medien und im Netz kommunizieren, geschriebene Berichte und E-mails in Unternehmen, juristische Dokumente und Patentbeschreibungen, Wissen in Bibliotheken und wissenschaftliche Publikationen abrufbar – Text ist die vorherrschende Kommunikationsform der heutigen Gesellschaft. Techniken des Textverstehens erschließen vielfältiges Wissen, das nur darauf wartet, zur Verbesserung der Kommunikation zwischen Menschen und Maschinen genutzt zu werden. In der letzten Zeit hat das automatische Textverstehen und die Extraktion von Semantik bedeutende Fortschritte gemacht.

Methoden

Wir erforschen und entwickeln Algorithmen, die unterschiedliche Arten von unstrukturierten Textdaten semantisch erschließen. Sie dienen zur Identifikation von Themen, die große Textkorpora effizient zusammenfassen, zur Extraktion von Bezeichnungen und Beziehungen für die Erfassung der Semantik und zur Analyse von Stimmungen, um subjektive, emotionale Färbungen durch den Autor zu beschreiben.

Deep-Learning-Algorithmen für große Datensammlungen

Neue Deep-Learning-Algorithmen machen die Textanalyse skalierbar auf sehr große Datensammlungen. Gekoppelt mit linguistischen Fachwissen und langjähriger praktischer Erfahrung erlaubt uns das, neue Einsichten aus allen möglichen Arten von Texten zu gewinnen. Unsere Forschung konzentriert sich auf besondere Herausforderungen und innovative Anwendungen von Textmining:

  • Social Media Mining im Netz, um Trends zu entdecken, Diskussionen zu verfolgen, Stimmungen und Interessen abzubilden
  • Extraktion von kompakten Informationen aus technischen Dokumentationen und Berichten, geschäftlichen Dokumenten wie Verträgen und Patenten, wissenschaftlichen Artikeln und anderen Textquellen
  • Lernen aus strukturierten und unstrukturierten Daten, Kombination von Textquellen mit Datenbanken und offenen verknüpften Daten
  • Mining in medizinischen Texten wie elektronischen Falldaten