Schulung: Data Science mit Spark
Spark ist das führende Framework für Data Science auf großen Daten.
Die klare Syntax und leicht verständliche Struktur machen es ideal für die Datenanalyse. Bei richtiger Verwendung macht Spark die Analyse großer Datenmengen einfach, effizient und bietet Unternehmen schnell neue Erkenntnisse aus ihren eigenen Daten.
In der Schulung erhalten Teilnehmer eine kompakte und umfassende Einführung in die Datenwissenschaft mit Spark.
Standardschulung Data Science mit Spark
Modul 1
Big Data Processing (1 Tag)
-
Big Data & Verteiltes Rechnen
-
Spark RDDs
-
Spark DataFrames
-
Datenmodellierung & Datenformate
Dauer: 3 Tage
Preis: 1.800 Euro
Ort: München oder Virtuell
Modul 2
Scalable Machine Learning (1 Tag)
-
Einführung Machine Learning
-
Machine learning models mit SparkML trainieren
-
Spark machine learning models umsetzen
-
Deep Learning & Spark
Modul 3
Practical Spark (1 Tag)
-
Wann ist Spark sinnvoll (und wann nicht)
-
Spark “behind the scenes” – die Spark-Parameter verstehen und optimieren
-
Monitoring & Debugging von Spark-Anwendungen
-
Identifikation von Performance-Bottlenecks und Performance-Optimierung
Teilnehmerkreis
Der Kurs richtet sich vornehmlich an Data Scientist, Engineers
und Entwickler mit Fokus auf Big Data,
kann aber auch für Business-Entscheider gestaltet werden.
Voraussetzungen
Praxis-Kenntnisse in Python.
Kursgröße
Der Kurs ist konzipiert für eine Teilnehmerzahl von 7-12 Personen.