
Einführung in Apache Spark
Umfassende Einführung in die Datenverarbeitung und -analyse mit Apache Spark.
Kursbeschreibung
Diese Schulung 'Einführung in Apache Spark' bietet eine umfassende Einführung der Datenverarbeitung und -analyse mit Apache Spark. Die Schulung ist darauf ausgerichtet, den Teilnehmern ein solides Verständnis für die Grundlagen von Apache Spark zu vermitteln sowie fortgeschrittene Konzepte und Anwendungen zu erläutern.
Die Teilnehmer werden in die Architektur von Apache Spark eingeführt und lernen, wie sie RDDs, DataFrames, Datasets, Spark SQL, Spark Streaming, MLlib und GraphX effektiv nutzen können. Durch praxisnahe Übungen und Anwendungen erhalten die Teilnehmer praktische Erfahrungen in der Entwicklung von Spark-Anwendungen und der Verarbeitung von Daten in Echtzeit.
Sie erfahren, wie Sie große Datenmengen effizient verarbeiten, Machine Learning-Modelle mit MLlib erstellen und Echtzeitdatenströme mit Spark Streaming analysieren können.
Dieser Kurs ist ideal für Data Engineers, Data Scientists und Entwickler, die ihre Big Data-Verarbeitungsfähigkeiten mit Apache Spark erweitern möchten.
Individueller Workshop
Für Unternehmen mit bestehender Apache Spark-Implementierung
Identifikation von Optimierungspotenzialen
Praxisnahe Beratung für Ihre Herausforderungen
Angepasst an Ihre Infrastruktur und Prozesse
Individuelle Terminvereinbarung möglich
Kursinhalt
Apache Spark Features im Fokus
Unser Training konzentriert sich auf die wichtigsten Apache Spark-Komponenten. Wir behandeln folgende Features im Detail:
Spark Core
RDDs, Transformationen, Aktionen
DataFrames & Datasets
Strukturierte Datenverarbeitung
Spark SQL
SQL-Abfragen auf Big Data
Spark Streaming
Echtzeitdatenverarbeitung
MLlib
Machine Learning mit Spark
GraphX
Graphenverarbeitung
Wir stimmen vor dem Training ab, welche Spark-Features für Ihre spezifischen Anwendungsfälle besonders relevant sind.
Das Wichtigste auf einen Blick
Das nehmen Sie mit
Solides Verständnis der Apache Spark-Architektur
Praktische Erfahrung mit RDDs, DataFrames und Datasets
Beherrschung von Spark SQL für Datenabfragen
Echtzeitdatenverarbeitung mit Spark Streaming
Machine Learning mit MLlib
Voraussetzungen
Grundlegende Kenntnisse in der Programmierung
Erfahrung mit Scala, Java oder Python
Grundlegendes Verständnis von Datenbanken und SQL
Basiswissen in der Datenverarbeitung
Trainingsumgebung
Praktische Übungen mit Apache Spark-Clustern
Umfangreiche Trainingsunterlagen und Code-Beispiele
Organisatorisches
Täglich von 9:00 bis 18:00 Uhr, inklusive Pausen
Schulungssprache, Materialien in Deutsch und Englisch
Ihr Trainer

Uli Zellbeck
Uli ist erfahrener Trainer und verfügt über 25 Jahre Erfahrung in der IT-Branche. Als Senior Data Architect bringt er ein tiefgreifendes Know-how im Aufbau von Datenarchitekturen mit. Seine Expertise erstreckt sich über verschiedene Bereiche der Informationstechnologie, und er hat sich insbesondere auf die Entwicklung fortschrittlicher Datenlösungen on Premise und in der Cloud spezialisiert.
Die Teilnehmer können von seinem reichen Erfahrungsschatz profitieren, während er praxisnahe Einblicke in die Verarbeitung von großen Datenmengen in Apache Spark zeigt. In den letzten Jahren hat er mehrere große Spark-Projekte implementiert und betreut, darunter:
- Implementation von Enterprise Spark-Clustern für Big Data-Verarbeitung
- Entwicklung von Spark-Anwendungen für Echtzeitdatenverarbeitung
- Integration von Spark mit verschiedenen Datenquellen und -senken
- Optimierung von Spark-Jobs für Performance und Skalierbarkeit
- Machine Learning-Pipelines mit MLlib und Spark ML
Seine praktische Expertise umfasst das gesamte Spektrum von Apache Spark - von der Grundkonfiguration über die Entwicklung komplexer Anwendungen bis hin zur Performance-Optimierung und dem Production-Deployment.
Verfügbare Termine
In-House Training
Umfassende Einführung in die Datenverarbeitung und -analyse mit Apache Spark.
Wir bieten dieses Training als In-House Schulung an, angepasst an Ihre Bedürfnisse. Termine und Konditionen sprechen wir gerne individuell mit Ihnen ab.
Unsere Partner
Öffentliche Termine
24.11.2024
Buche das Training direkt im Terminal
Weitere passende Trainings
Vertiefen Sie Ihr Wissen mit unseren praxisorientierten Big Data und Data Engineering-Schulungen
Datenmodellierung und Architekturen
Datenmodellierung und Architekturen Training: Lernen Sie fortgeschrittene Konzepte für skalierbare und effiziente Datenstrukturen.
- Verschiedene Datenmodellierungsansätze verstehen
- Relationale und NoSQL-Modelle vergleichen
- Datenqualität und -integrität sicherstellen
dbt
Praxisnahes dbt-Training: Beherrschen Sie SQL-Transformationen, Testing und CI/CD für nachhaltige Analytics-Engineering-Prozesse.
- dbt Projekte aufsetzen und strukturieren
- Datenmodelle mit SQL und dbt entwickeln
- Tests für Datenqualität implementieren
Modern Data Warehouse
Modern Data Warehouse Training: Konzipieren und implementieren Sie skalierbare Cloud-Datenplattformen mit modernsten Technologien.
- Moderne DWH-Architekturen konzipieren
- Cloud-basierte Data Warehouse implementieren
- ELT-Prozesse mit dbt aufbauen