Schulung
Data Science mit Spark
Spark ist das führende Framework für Data Science auf großen Daten.
Die klare Syntax und leicht verständliche Struktur machen es ideal für die Datenanalyse. Bei richtiger Verwendung macht Spark die Analyse großer Datenmengen einfach, effizient und bietet Unternehmen schnell neue Erkenntnisse aus ihren eigenen Daten.
In der Schulung erhalten Teilnehmer eine kompakte und umfassende Einführung in die Datenwissenschaft mit Spark.

Standardschulung
Data Science mit Spark
Dauer: 3 Tage
Preis: 1.800 Euro
Ort: München oder Virtual
Modul 1
Big Data Processing (1 Tag)
-
Big Data & Verteiltes Rechnen
-
Spark RDDs
-
Spark DataFrames
-
Datenmodellierung & Datenformate
Modul 2
Scalable Machine Learning (1 Tag)
-
Einführung Machine Learning
-
Machine learning models mit SparkML trainieren
-
Spark machine learning models umsetzen
-
Deep Learning & Spark
Modul 3
Practical Spark (1 Tag)
-
Wann ist Spark sinnvoll (und wann nicht)
-
Spark “behind the scenes” – die Spark-Parameter verstehen und optimieren
-
Monitoring & Debugging von Spark-Anwendungen
-
Identifikation von Performance-Bottlenecks und Performance-Optimierung
Teilnehmerkreis
Der Kurs richtet sich vornehmlich an Data Scientist, Engineers
und Entwickler mit Fokus auf Big Data,
kann aber auch für Business-Entscheider gestaltet werden.
Voraussetzungen
Praxis-Kenntnisse in Python.
Kursgröße
Der Kurs ist konzipiert für eine Teilnehmerzahl von 7-12 Personen.

Dr. Thomas Bonfert, Seminarleiter
Dr. Thomas Bonfert leitet den Bereich Sensor Data Analytics und nutzt mit seinem Team Spark seit mehreren Jahren in Kundenprojekten zur Beschleunigung der Datenverarbeitung bei Skalierung bis in den Petabyte-Bereich.
"Big Data wandelt sich vom Buzz-Wort zum Werkzeug, das in den Toolboxen von Data Scientist, Data Engineers und Application Developers unverzichtbar wird. In diesem Kurs vermittle ich meinen Teilnehmern sowohl die Grundlagen von Big Data als auch die Tricks und Kniffe für die effiziente Anwendung in der Praxis."