Anonymizer

Sensible Daten mit KI anonymisieren

Mit dem Anonymizer ermöglichen wir Organisationen aus Forschung, Verwaltung und Wirtschaft, ihre Textdaten datenschutzkonform zu nutzen, ohne dass der inhaltliche Wert verloren geht. Das System identifiziert automatisch personenbezogene oder vertrauliche Informationen in Dokumenten und ersetzt sie durch neutrale Platzhalter. So lassen sich Texte weiterhin analysieren, auswerten oder weiterverarbeiten, mit der Sicherheit, dass Datenschutzanforderungen erfüllt werden. 

In nahezu allen Branchen werden täglich riesige Mengen an Textdaten verarbeitet: Berichte, Gutachten, Kommunikationsprotokolle und mehr. Viele dieser Dokumente enthalten sensible Informationen wie Namen, Adressen oder Identifikationsnummern. Bisherige Anonymisierungsverfahren sind oft manuell, unsicher oder ressourcenintensiv. Gerade in regulierten Umgebungen, z. B. im Gesundheitswesen, in der Verwaltung oder im Rechtswesen, steigt die Notwendigkeit, personenbezogene Daten zuverlässig zu schützen und gleichzeitig Datenanalysen zu ermöglichen.

Unser Anonymizer kombiniert maschinelles Lernen mit regelbasierten Verfahren zu einem hybriden KI-System, das besonders effizient, adaptiv und erklärbar ist.

  • Automatisierte Entitätserkennung: Modelle analysieren Text und erkennen personenbezogene Elemente wie Namen, Orte, Organisationen oder Kennzahlen.
  • Regelbasiertes Ergänzungsmodul: Typische Muster (z. B. E-Mail, IBAN, Telefonnummer) werden ergänzend abgesichert.
  • Flexible Anonymisierungsstrategien: Sie können entscheiden, ob Inhalte maskiert, ersetzt oder umgeschrieben werden, je nach Anwendungsfall und Risiko.
  • Transparenz & Nachvollziehbarkeit: Jede Anonymisierung ist dokumentierbar; Rückverfolgung und Audits sind möglich.
     

Jetzt anfragen

Einsatzmöglichkeiten

Finanzen, Recht, Gesundheitswesen, öffentlicher Sektor

  • Nutzer von externen Systemen/Cloud-Services, die ihre Daten schützen wollen
  • KI-Entwicklerinnen und -Anbieter, die mit sensiblen Daten arbeiten

Technische Infos

  • Modularer Aufbau: Die Architektur ist so gestaltet, dass Komponenten (Erkennung, Regelmodule, Umformung) individuell nutzbar sind.
  • Ressourceneffizienz durch Distillation: Ein leichtgewichtiges Modell übernimmt zentral die Anonymisierung, basierend auf automatisch erzeugten Trainingsdaten.
  • Skalierbarkeit: Der Anonymizer ist für große Textmengen in unterschiedlichen Sprachen und Domänen geeignet.
  • Sicherheitsprinzipien: Lokaler Betrieb und Kontrolle durch den Nutzer sind unkompliziert möglich, es ist kein Datenaustausch mit Cloud-Diensten nötig.

Was sind die Vorteile des Anonymizers für Unternehmen?

  • Datenschutzkonforme Nutzung sensibler Daten
  • Erhalt des inhaltlichen Mehrwerts von Texten
  • Transparente und dokumentierte Anonymisierung
  • Skalierbar für große Datenvolumen
  • Keine Abhängigkeit von externen Diensten
  • Flexibel anpassbar an Fachdomänen

Wie sorgt der Anonymizer für besseren Datenschutz?

Der Anonymizer basiert auf hybrider KI. Diese Technologie verbindet z. B. datengetriebene Lernverfahren mit logischem und domänenspezifischem Wissen. So entstehen Systeme, die nicht nur Muster erkennen, sondern Entscheidungen nachvollziehbar und sicher treffen können.

Das bedeutet, dass der Anonymizer personenbezogene Informationen im Kontext richtig versteht und bewertet. Die sensiblen Daten werden anonymisiert und die Entscheidung transparent dokumentiert – ein entscheidender Schritt hin zu vertrauenswürdiger KI und für besseren Datenschutz.

Weiterführende Informationen

 

Aus unserer Forschung

Hybride Künstliche Intelligenz

Wir forschen am Fraunhofer IAIS intensiv an hybriden KI-Systemen, die datenbasiertes Maschinelles Lernen, Welt- bzw. Expertenwissen und logisches Schlussfolgern kombinieren. Erfahren Sie mehr über unsere Forschungsschwerpunkte und -kooperationen, welche Vorteile die Technologie hat und wo der Einsatz von hybrider KI besonders sinnvoll ist.

Aus unserer Forschung

Knowledge Distillation

Große Sprachmodelle können personenbezogene Informationen präzise erkennen, doch ihr Einsatz ist oft teuer und ressourcenintensiv. Durch Knowledge Distillation lässt sich dieses Wissen auf kleinere, effiziente Modelle übertragen, die lokal und datenschutzkonform betrieben werden können.

In aktuellen Forschungsarbeiten wird dieser Ansatz genutzt, um Modelle zur automatischen Textanonymisierung zu trainieren, ohne manuell annotierte Daten zu benötigen. Ein leistungsstarkes Lehrermodell erstellt synthetische Trainingsdaten, mit denen ein kompaktes Studierendenmodell lernt, sensible Entitäten zuverlässig zu erkennen und zu anonymisieren. So entstehen Systeme, die präzise, transparent und skalierbar sind und Datenschutz auf hohem technologischem Niveau ermöglichen.

Veröffentlichungen zum Anonymizer

Wissenschaftliche Paper