Schulung: Data Science mit Spark

Spark ist das führende Framework für Data Science auf großen Daten.

Die klare Syntax und leicht verständliche Struktur machen es ideal für die Datenanalyse. Bei richtiger Verwendung macht Spark die Analyse großer Datenmengen einfach, effizient und bietet Unternehmen schnell neue Erkenntnisse aus ihren eigenen Daten.

 

In der Schulung erhalten Teilnehmer eine kompakte und umfassende Einführung in die Datenwissenschaft mit Spark.

Standardschulung Data Science mit Spark
 

Modul 1

Big Data Processing (1 Tag)

  • Big Data & Verteiltes Rechnen

  • Spark RDDs

  • Spark DataFrames 

  • Datenmodellierung & Datenformate

 

Dauer: 3 Tage 
Preis: 1.800 Euro 
Ort: München oder Virtuell

 

Modul 2

Scalable Machine Learning (1 Tag)

  • Einführung Machine Learning

  • Machine learning models mit SparkML trainieren

  • Spark machine learning models umsetzen

  • Deep Learning & Spark

Modul 3

Practical Spark (1 Tag)

  • Wann ist Spark sinnvoll (und wann nicht)

  • Spark “behind the scenes” – die Spark-Parameter verstehen und optimieren

  • Monitoring & Debugging von Spark-Anwendungen

  • Identifikation von Performance-Bottlenecks und Performance-Optimierung

Teilnehmerkreis

Der Kurs richtet sich vornehmlich an Data Scientist, Engineers

und Entwickler mit Fokus auf Big Data,

kann aber auch für Business-Entscheider gestaltet werden.

Voraussetzungen

Praxis-Kenntnisse in Python.

Kursgröße

Der Kurs ist konzipiert für eine Teilnehmerzahl von 7-12 Personen.