Dialogsysteme ermöglichen intuitive Interaktion in B2B-Anwendungen

Wir entwickeln sprachgesteuerte Dialogsysteme mit Fokus auf domänenspezifischem Wissen für den Einsatz in verschiedenen Bereichen der Wirtschaft und Industrie. Durch die Kombination modernster Komponenten für Spracherkennung, Question Answering via Wissensgraphen und Sprachsynthese adressieren unsere Technologien die Herausforderungen und Bedürfnisse von Unternehmen und B2B-Anwendungen.

Dialogsysteme

Sprachsysteme für Business-Anwendungen in spezifischen Wissensbereichen

Sprachassistenten werden in immer mehr Lebensbereichen eingesetzt und ermöglichen eine intuitive Interaktion mit der Technik sowie Service und Informationen. Sie sind nicht nur im Alltag nützlich, sondern bieten Unternehmen auch ein großes Potenzial, die Interaktion zwischen Mensch und Maschine zu erleichtern und den Kunden völlig neue Dienstleistungen anzubieten.

Wir entwickeln sprachgesteuerte Dialogsysteme mit Fokus auf domänenspezifischem Wissen für den Einsatz in verschiedenen Bereichen der Wirtschaft und Industrie. Durch die Kombination modernster Komponenten für Spracherkennung, Question Answering via Wissensgraphen und Sprachsynthese adressieren unsere Technologien die Herausforderungen und Bedürfnisse von Unternehmen und B2B-Anwendungen.

Technologien »made in Germany« sichern technologische Souveränität  

Darüber hinaus gewährleisten diese Technologien technologische Souveränität: Daten können in sicheren Datenräumen gespeichert und verarbeitet werden. Die im Rahmen des »Fraunhofer-Cluster of Excellence Cognitive Internet Technologies CCIT« (Zentrum Maschinelles Lernen) entwickelten Methoden des »Informed Machine Learning« sorgen dafür, dass die Systeme auch auf kleinen Datensätzen trainiert werden können.

Unser Angebot   

  • Unser Team entwickelt Dialogsysteme mit domänenspezifischem Wissen für Anwendungen in verschiedenen Bereichen der Wirtschaft und Industrie.
  • Wir bieten eine Reihe von adaptierbaren State-of-the-Art-Komponenten für gesprochene Dialogsysteme – von Spracherkennung über Dialogmanagement bis hin zur Sprachsynthese.
  • Wir passen die Systeme an Ihre spezifischen Anforderungen an und helfen Ihnen, semantisch strukturiertes Wissen aus verschiedenen Datenquellen zu nutzen.
  • Darüber hinaus unterstützen wir Sie bei der Entwicklung neuer Geschäftsmodelle mit Dialogsystemen.
  • Wir gewährleisten digitale Souveränität, Ihre Daten werden in sicheren Datenräumen gespeichert und verarbeitet.

State-of-the-Art Komponenten für B2B-Dialogsysteme

© Fraunhofer IAIS

1. Spracherkennung – Speech to Text

Die Aufgabe der Spracherkennung ist das Umwandeln von gesprochener Sprache in Text. Dabei erfolgt die sprachliche Modellierung mit Hilfe von Machine-Learning-Algorithmen: Das Sprachmodell wird auf ein bestimmtes Wissensgebiet trainiert, damit die Aussprache der Wörter fachspezifisch korrekt erfolgt. Zudem lernt das System übliche Wortabfolgen und Dialekte oder Akzente.
 

2. Question Answering via Wissensgraphen

Erst das domänenspezifische Wissen macht das Sprachsystem nützlich in bestimmten fachspezifischen Anwendungsbereichen. Hierfür nutzen wir Question-Answering-Technologien (QA). Die Herausforderung auf der technologischen Seite besteht dabei darin, die Anfragen der Nutzer zu verstehen und mithilfe von speziellen Informationen aus verschiedenen Quellen zu beantworten.

Dafür muss das System erkennen, um welche Wissensdomäne – zum Beispiel Wetter, Notfallmanagement oder Geschäftsprozesse – es sich bei der Anfrage handelt. Fachliches Wissen ist komplex und lässt sich am besten in einem Knowledge Graph organisieren. Ein solcher Wissensgraph verknüpft Wissen zu einem Netzwerk von Daten und Informationen und stellt Informationen maschinenlesbar zur Verfügung.

So erkennt ein Intent Classifier das Thema und sucht die faktische Antwort. Mit Hilfe von Verbalisierungstechniken sorgt das System anschließend dafür, dass die Antwort ausformuliert ausgegeben wird. Zugeschnitten auf die jeweiligen Wissens-Domänen trainieren unsere Experten Machine-Learning-Algorithmen mithilfe von Beispieldialogen und Frage-Antwort-Paaren.
 

3. Sprachsynthese – Text to Speech

Die Sprachsynthese vervollständigt das System, indem sie die Text-Informationen der QA in gesprochene Sprache umwandelt. Dieses Verfahren beruht ebenfalls auf maschinellem Lernen: Mit Hilfe von transkribierten Audio-Aufnahmen lernt das Modell, eine Wellenform aus Buchstaben zu generieren, die über Lautsprecher wiedergegeben werden und so von den Anwendern gehört werden kann.

Anwendungsbeispiele für Dialogsysteme

© Fraunhofer IAIS

© Fraunhofer IAIS

Unsere Dialogsysteme fokussieren auf domänenspezifisches Wissen, die für bestimmte Anwendungsfelder trainiert werden können. Das System wird je nach Einsatzgebiet angepasst und ist bereits als Prototyp entwickelt oder bereits im Einsatz in verschiedenen Anwendungsbereichen:

  • Sie können Geschäftsprozesse unterstützen oder helfen, in Unternehmens- oder Medienarchiven die richtige Information schnell zu finden.
  • Integriert im Auto dient das Dialogsystem dem Fahrer als interaktiver Stadtführer, der Fragen zur Umgebung und wichtigen Gebäuden beantwortet.
  • Medizinische Geräte werden, ausgestattet mit einem Sprachassistenten, vom Fachpersonal per Spracheingabe und durch Gesten gesteuert. In Kombination mit Methoden der Wissensextraktion aus medizinischen Dokumenten erhalten Ärztinnen und Ärzte bei der Erstellung von Diagnosen wichtige Unterstützung.
  • Die Dialog-Technologie kann wertvolle Zeit sparen, etwa wenn Rettungskräfte sich beim Notfall-Einsatz in einem Firmengebäude via Headset schnelle Antworten auf lebensrettende Fragen holen.