KI-basierte Systeme müssen ihr Umfeld zuverlässig erkennen, um sicher mit Menschen und der Umwelt interagieren zu können.

Computer Vision

Intelligente Systeme müssen Personen und Objekte anhand von visueller Information aus Bildern oder Videos zuverlässig erkennen und ein Verständnis für komplexe Umgebungen entwickeln. Dies ist eine Grundvoraussetzung für das sichere Interagieren von Fahrzeugen und mobilen Robotern mit ihrer Umwelt. Auch der Einsatz von Künstlicher Intelligenz in der Zustandsüberwachung und Qualitätskontrolle stellt hohe Anforderungen an die Verarbeitung visueller Informationen.

Langjährige Erfahrung mit Maschinellem Lernen in der Bildverarbeitung verschafft uns eine starke Position. Unsere Systeme haben sich bereits in der Praxis im Einsatz in unterschiedlichen Anwendungsgebieten und Branchen bewährt: Wir bieten beispielsweise Lösungen zur Erkennung von Verkehrszeichen, zur Zustandsüberwachung für Infrastrukturen, zur Schadenserkennung und Qualitätsanalyse.

Für die echtzeitfähige Erkennung von Objekten und die Umfeldanalyse können wir auf einen eigenen Technologiekern für Bildverarbeitung und ein Framework für neuronale Netze zurückgreifen. Zur Analyse eines komplexen Umfeldes, beispielsweise einer Verkehrssituation, ist es oft nötig, Informationen aus verschiedenen Quellen zu kombinieren und auf verteilten Geräten zu verarbeiten.

Diese kollaborierenden Systeme stellen besondere Ansprüche an Ressourceneffizienz und erfordern spezielle Techniken für die Fusion von Daten aus verschiedenen Sensoren. Daher arbeiten wir an eigen¬ständigen Edge-Computing-Systemen und Techniken, die beispielsweise ein Tracking von Objekten durch mehrere Sichtbereiche ohne eine zentrale Cloud ermöglichen.

Bei der Erkennung von Fehlern und Qualitätsmängeln in der industriellen Produktion stoßen klassische Verfahren des Maschinellen Lernens oft an ihre Grenzen. Für Fehler und Probleme, die selten auftreten, steht naturgemäß eine eher kleine Datenbasis zur Verfügung. Wir können für diese Anwendungsszenarien Hybridverfahren und Modelle entwickeln, die domänenspezifisches Expertenwissen einbinden und somit auch mit kleineren Datensätzen erfolgreich trainiert und eingesetzt werden können.

Leistungsportfolio

Unsere Kunden stammen aus den Bereichen Automobil, Verkehr, Logistik, Infrastruktur und Medien. Mit unseren Systemen zur Bilderkennung und -analyse sind wir in der Lage, Personen und Objekte zu erkennen sowie Fehler und Qualitätsmängel zu identifizieren.

Datenbewertung und -verbesserung

Wir bewerten die Verlässlichkeit der Bild-erkennung, kompensieren Verzerrungen und verbessern die Datengrundlage durch Datenaugmentierung.

Objekterkennung

Wir entwickeln Anwendungen zur Echtzeiterkennung vielfältiger Objekte (zum Beispiel Verkehrszeichen) und Phänomene (Schäden) in Videos. Unsere Gesichtserkennung ermöglicht beispielsweise die Suche nach Personen öffentlichen Interesses in Videoarchiven.

Semantische Segmentierung in 3D-Daten

Die semantische Segmentierung in 3D-Daten ermöglicht es, in einem Umfeld zusammenhängende Struk­turen zu erkennen und zuzuordnen.

Umfelderkennung

Aufbauend auf der Umfeld­erkennung im Verkehrsbereich entwickeln wir Anwendungen für das sichere Navigieren in besonderen Umgebungen wie Baustellen, Lagerhallen und Gebäuden.

Dezentrale und kollaborative Bildanalyse

Für Anwendungen auf mobilen Geräten und für kollaborative Systeme gestalten wir neuronale Netze so, dass diese mit möglichst wenig Ressourcen auskommen. Zudem fusionieren wir Daten von multiplen Sensoren und streben die Nutzung auf eigen­ständigen Edge-Computing-Systemen an.

Highlights

Bildbasierte Schadenserkennung im Kanalisationssystem

Viele Kanalnetze sind sanierungsbedürftig, doch aufgrund des hohen manuellen Aufwandes geht die Inspektion der Kanalsysteme nur langsam voran. Eine automatische Erfassung von Schäden ist nur dann wirtschaftlich sinnvoll, wenn die Detektion mit ausreichend hoher Genauigkeit funktioniert. In einem Projekt mit den Berliner Wasserbetrieben haben wir Algorithmen für die Detektion von Schäden und ihre Einteilung nach Typ und Schwere entwickelt.

Erkennung von Verkehrszeichen im Baustellenbereich

Egal ob rund, dreieckig, rechteckig oder achteckig, unsere Lösung erkennt die verschiedenen Schilder der StVO-Palette. Anspruchsvoll wird es, wenn ein Hinweisschild spezifische Informationen enthält: eine Geschwindigkeitsbegrenzung, die aus Lärmschutzgründen an bestimmte Tageszeiten gekoppelt ist, oder komplizierte Spurführungszeichen. Durch Verbindung von Bild- und Texterkennung liest unsere Lösung auch die Texte aus und versteht die Anordnung mehrerer Schilder. So erhalten Fahrer und Navigationssysteme genau die Informationen, die aktuell relevant sind.

Zustandsüberwachung von Schieneninfrastrukturen

Auf dem mehr als 33 000 Kilometer langen Schienennetz der Deutschen Bahn bergen vor allem umgestürzte Bäume ein hohes Risiko. Mit namhaften Partnern aus Eisenbahnwesen und Forschung entwickeln wir eine Technologie zur 3D-Rekonstruktion und -Analyse des Streckennetzes. Unsere Software erkennt relevante Objekte automatisch und ermittelt deren Abweichungen von Sollwerten. Die Ergebnisse der Analyse visualisiert eine Anwendung eines unserer Partnerunternehmen, sodass Infrastrukturbetreiber die nötigen Instandhaltungsprozesse anstoßen und planen können.

Bildgestützte Erkennung von Schäden

In der industriellen Qualitätssicherung stoßen maschinelle Lernverfahren zur automatischen Schadens- oder Fehlererkennung an ihre Grenzen, wenn nicht genügend geeignete Trainingsdaten vorhanden sind. Im Kontext des Fraunhofer-Forschungszentrums Maschinelles Lernen haben wir Verfahren entwickelt, um durch Einbindung von domänenspezifischem Expertenwissen leistungsfähige Deep-Learning-Systeme auch auf kleineren Datensätzen erfolgreich zu trainieren – beispielsweise für die automatische Erkennung von Hagelschäden an Fahrzeugen oder von Materialfehlern auf glatten Oberflächen in der industriellen Produktion.

Virtuelle Bandenwerbung

Bei großen Veranstaltungen werden oft LED-Banden eingesetzt, die elektronisch angesteuert wechselnde und animierte Bildinhalte zeigen. Alle Fernsehzuschauer sehen die gleiche Werbung, denn eine länderspezifische Ausrichtung bei einem Livekamerabild war bisher nicht möglich, zumindest nicht in befriedigender Qualität. Das von uns entwickelte System erlaubt die Veränderung der Werbeinhalte von LED-Banden in Echtzeit, so dass beliebig viele TV-Streams mit jeweils unterschiedlicher virtueller Werbung erzeugt werden können. Der Zuschauer bemerkt nicht, dass er nicht das Originalbild aus dem Sportstadion sieht und in seinem TV-Bild die Bandenwerbung verändert wurde. Dies eröffnet völlig neue Businessmodelle für die Vermarktung von Werberechten bei Sportereignissen.