Data Quality and Data Preprocessing

Daten sind der Rohstoff der Zukunft, nur hochwertige Daten bieten Unternehmen einen Mehrwert. Aufgrund unterschiedlich hoher Datenqualität stellt Data Preprocessing die zeitaufwendigste Phase im Data Mining und beim Einsatz von Machine Learning dar. In diesem Seminar lernen daher Fachleute mit Grundkenntnissen im Bereich Datenanalysen und erster Programmiererfahrung wesentliche Grundlagen der modernen Datenvorverarbeitung kennen. Für die praktischen Übungen werden zwei Datensätze über das Seminar unter dem Einsatz von Python und KNIME vorverarbeitet. Nach der Schulung sind Sie in der Lage, die Datenvorverarbeitungen in Ihren Einsatzfällen strukturiert und effizient durchzuführen.

Diese Schulung stellt eine sinnvolle Vertiefung des Moduls 3 der Schulung Data Scientist Specialized in Data Management (zertifiziert) dar.

Zielgruppe: Analysten, die ihre Fähigkeiten zur Datenaufbereitung ausweiten wollen.

Softwareentwickler/-architekten, die Lösungen für analytische Fragestellungen entwickeln. 

Interessierte aus der Forschung, die eine Orientierung im Bereich Data Science suchen.

Voraussetzungen: Grundkenntnisse in Statistik und Datenanalyse werden vorausgesetzt; Basiswissen in Programmierung und im Umgang mit Datenbanken sind von Vorteil.

Inhalt

Tag 1

  • Data Set Properties, Requirements from Use Case, External Requirements
  • Data Quality Check
  • Data Integration & Synchronization
  • Data Cleaning

Tag 2

  • Data Reduction
  • Data Augmentation & Balancing
  • Data Transformation
  • Data Quality Assessment & Data Preprocessing Performance Measures

Rahmen

Dauer: 2 Tage

Tagungssprache: deutsch

Maximale Teilnehmerzahl: 12
Die Anmeldungen werden in der Reihenfolge des Eingangs berücksichtigt.

Veranstaltungsort:

Fraunhofer Institutszentrum Schloss Birlinghoven
53757 Sankt Augustin

Teilnahmegebühr: 

1.900 Euro

Die Teilnahmegebühr ist steuerfrei gem. § 4 Nr. 22a UStG. Sie umfasst Begleitunterlagen (auf Englisch) und Verpflegung. 

Bitte beachten Sie die Storno- und Teilnahmebedingungen.

Falls Sie die Anmeldung über eine Bestellung vornehmen, erbitten wir eine Kopie der Bestellung an "datascientist(at)iais.fraunhofer.de".

Termine und Anmeldung

* Pflichtfelder

Termine
Hinweis: Gemäß Datenschutzgrundverordnung (DSGVO) unterrichten wir Sie über die Speicherung Ihrer Daten. Die Einwilligung zur Speicherung und Nutzung Ihrer Daten erfolgt freiwillig und kann jederzeit widerrufen werden.
Stornogebühren

Unsere Referenten

Dipl. Inf. Daniel Trabold arbeitet als wissenschaftlicher Mitarbeiter am Fraunhofer IAIS an der Entwicklung von Verfahren und Grundlagen des Fraud Mining. Er hat langjährige Erfahrung im Data Mining und als Entwickler in angewandten Wirtschafts- und Forschungsprojekten, insbesondere in den Industrien Finance, Automotive und Telekommunikation. Seine aktuellen Arbeitsschwerpunkte sind echtzeitfähige Big-Data-Architekturen und Data-Mining-Algorithmen.

Jonathan Krauß ist Wissenschaftlicher Mitarbeiter in der Abteilung für Produktionsqualität am Fraunhofer-Institut für Produktionstechnologie IPT, Aachen. Neben klassischen Themen der Lean Production und des Qualitätsmanagements sind neue Methoden zur Qualitätssteigerung wie Data Analytics, Smart Devices und Datenmanagement in den Fokus der Abteilung gerückt.