Data Scientist Specialized in Big Data Analytics (zertifiziert)

 

Data Scientist Specialized in Big Data Analytics

 

Diese Schulung schließt an die Angebote »Data Scientist Basic Level« und »Data Scientist Specialized in Data Analytics« an. Fachkräfte mit Programmiererfahrung und Grundkenntnissen in der Datenanalyse lernen Methoden und Tools zur Analyse von Big Data kennen. Nach der Schulung verstehen Sie, wie Analysealgorithmen für eine skalierbare Big-Data-Architektur implementiert werden und haben Beispiele für Batch- und Streaming-Verarbeitung kennengelernt. Sie lernen den Einsatz von Tools und Methoden zur Analyse von großen Datenmengen am Beispiel von Spark kennen, wobei insbesondere die Algorithmen aus Spark Machine Learning Library sowie Anbindung von Spark an Python (PySpark) vorgestellt und selbst eingeübt wird. Unter dem Thema "Deployment" wird besprochen, wie Modelle, die im Batch auf historischen Daten erstellt worden sind, auf neuen Daten schnell angewendet werden können. Des weiteren wird die Einbindung von Streaming-Systemen und Methoden der Datenanalyse unter Echtzeitanforderungen besprochen. 

 

Die Zertifizierung findet durch die Fraunhofer-Personenzertifizierungsstelle statt. Das Zertifikat bescheinigt den Absolventen relevantes innovatives Praxiswissen und nachgewiesene Kompetenz.

Zielgruppe: Analysten, die ihre Fähigkeiten zur Auswertung von großen Datenbeständen ausweiten möchten.Softwareentwickler/-architekten, die Systeme mit analytischen Fragestellungen entwickeln.

Voraussetzung: Grundkenntnisse in Statistik und Programmierung sowie grundlegender Aufbau von Systemarchitekturen.

Empfehlung: Kombinieren Sie dieses Angebot mit der Schulung »Data Scientist Basic Level« am selben Ort. 

 

 

Inhalte

 

Tag 1: Einbettung von Modellerstellung- und Anwendung in eine Big Data Architektur

  • • Einführung: Herausforderungen von Big Data für die Datenanalyse
  • • Beispiel: Aufbau eines Empfehlungssystems
  • • Data Understanding und Feature-Erzeugung für die Analyse großer Datenmengen 
  • • Modellentwicklung und -anwendung in Big-Data-Umgebungen
  • • Analyse von Datenströmen

Tag 2: Datenanalyse mit Spark

  • • Einführung von Spark und PySpark
  • • Lineare Regression mit Spark
  • • Die Spark Maschine Learning Library
  • • Übungen zur Datenanalyse mit Spark und Python
  • • Graphische Workflows zur Datenanalyse mit Spark
  • • Big Data Algorithmen: Locality Sensitive Hashing und Anwendungen

Tag 3: Fortgeschrittene Methoden, Werkzeuge und Deployment

  • • Fortgeschrittene Analystetechniken in Spark (Training-Test Dataset, Optimization, Cross-Validation, Grid-Search, Pipelines)
  • • Betrugserkennung mit Complex Event Processing (CEP)
  • • Deployment: Abspeichern, Laden von Modellen in PMML und Spark
  • • Einsatz von Spark Feature-Generation, Spark Pipelines und Spark Streaming
  • • Massiv Parallele Datenbanken

Tag 4: Praktische Anwendung fortgeschrittener Analysemethoden mit PySpark

  • • Data verstehen, aufbereiten
  • • Erzeugen von Features 
  • • Spark Machine Learning Library Pipelines
  • • Big Data Algorithmen 

Tag 5

  • • Schriftliche Prüfung

 

Rahmen

Dauer: 4 Tage + Prüfung an Tag 5

Tagungs- und Prüfungssprache: deutsch

Maximale Teilnehmerzahl: 15
Die Anmeldungen werden in der Reihenfolge des Eingangs berücksichtigt.

Abschluss: Prüfung und Zertifikat »Data Scientist Specialized in Big Data Analytics«

Veranstaltungsort:

    Fraunhofer-Institut IAIS

    Schloss Birlinghoven

    53754 Sankt Augustin

Teilnahmegebühr: 4.350 Euro

Die Teilnahmegebühr ist steuerfrei gem. § 4 Nr. 22a UStG. Sie umfasst Begleitunterlagen (auf Englisch) und Verpflegung.  

Bitte beachten Sie die Storno- und Teilnahmebedingungen sowie die Datenschutzerklärung.

Falls Sie die Anmeldung über eine Bestellung vornehmen, erbitten wir eine Kopie der Bestellung an "datascientist(at)iais.fraunhofer.de".

Dozenten: Das Basisseminar wird von verschiedenen erfahrenen Dozenten aus unserem Data-Science-Schulungsprogramm durchgeführt.
Dozenten: Das Basisseminar wird von verschiedenen erfahrenen Dozenten aus unserem Data-Science-Schulungsprogramm durchgeführt.
Dozenten: Das Basisseminar wird von verschiedenen erfahrenen Dozenten aus unserem Data-Science-Schulungsprogramm durchgeführt.

Termine und Anmeldung

* Pflichtfelder

Termine
Hinweis: Gemäß Datenschutzgrundverordnung (DSGVO) unterrichten wir Sie über die Speicherung Ihrer Daten. Die Einwilligung zur Speicherung und Nutzung Ihrer Daten erfolgt freiwillig und kann jederzeit widerrufen werden.
Stornogebühren

Unsere Referenten

Dr. Gunar Ernis hat in der Experimentellen Teilchenphysik promoviert und ist seit 2016 beim Fraunhofer IAIS als Data Scientist tätig. Er beschäftigt sich intensiv mit der Analyse von Daten im industriellen Umfeld (Industrie 4.0) und ist dort in mehreren Projekten aktiv, die sich mit Condition Monitoring und Predictive Maintenance befassen.

PD Dr. Michael Mock ist Senior Scientist am Fraunhofer IAIS. Seine Forschungsinteressen fokussieren auf verteilte Systeme und Echtzeitsysteme. Er hat langjährige Erfahrung in der Leitung von Forschungs- und Entwicklungsprojekten sowie in der Lehre als Privat-Dozent. Aktuelle Arbeitsschwerpunkte sind echtzeitfähige Architekturen im Big-Data-Bereich.