Hintergrundbild

Einführung in Apache Spark

Umfassende Einführung in die Datenverarbeitung und -analyse mit Apache Spark.

Dauer
3 Tage
Level
Einsteiger
Ort
Vor Ort, Linuxhotel Essen
Nächster Termin
24. November 2024

Kursbeschreibung

Diese Schulung 'Einführung in Apache Spark' bietet eine umfassende Einführung der Datenverarbeitung und -analyse mit Apache Spark. Die Schulung ist darauf ausgerichtet, den Teilnehmern ein solides Verständnis für die Grundlagen von Apache Spark zu vermitteln sowie fortgeschrittene Konzepte und Anwendungen zu erläutern.

Die Teilnehmer werden in die Architektur von Apache Spark eingeführt und lernen, wie sie RDDs, DataFrames, Datasets, Spark SQL, Spark Streaming, MLlib und GraphX effektiv nutzen können. Durch praxisnahe Übungen und Anwendungen erhalten die Teilnehmer praktische Erfahrungen in der Entwicklung von Spark-Anwendungen und der Verarbeitung von Daten in Echtzeit.

Sie erfahren, wie Sie große Datenmengen effizient verarbeiten, Machine Learning-Modelle mit MLlib erstellen und Echtzeitdatenströme mit Spark Streaming analysieren können.

Dieser Kurs ist ideal für Data Engineers, Data Scientists und Entwickler, die ihre Big Data-Verarbeitungsfähigkeiten mit Apache Spark erweitern möchten.

Individueller Workshop

Für Unternehmen mit bestehender Apache Spark-Implementierung

Bewertung Ihres aktuellen Einsatzes
Identifikation von Optimierungspotenzialen
Lösung spezifischer Fragestellungen
Praxisnahe Beratung für Ihre Herausforderungen
Maßgeschneiderte Schulung
Angepasst an Ihre Infrastruktur und Prozesse
Workshop anfragen

Individuelle Terminvereinbarung möglich

Kursinhalt


Apache Spark Features im Fokus

Unser Training konzentriert sich auf die wichtigsten Apache Spark-Komponenten. Wir behandeln folgende Features im Detail:

Spark Core

RDDs, Transformationen, Aktionen

DataFrames & Datasets

Strukturierte Datenverarbeitung

Spark SQL

SQL-Abfragen auf Big Data

Spark Streaming

Echtzeitdatenverarbeitung

MLlib

Machine Learning mit Spark

GraphX

Graphenverarbeitung

Wir stimmen vor dem Training ab, welche Spark-Features für Ihre spezifischen Anwendungsfälle besonders relevant sind.

Das Wichtigste auf einen Blick

Das nehmen Sie mit

Solides Verständnis der Apache Spark-Architektur

Praktische Erfahrung mit RDDs, DataFrames und Datasets

Beherrschung von Spark SQL für Datenabfragen

Echtzeitdatenverarbeitung mit Spark Streaming

Machine Learning mit MLlib

Voraussetzungen

Grundlegende Kenntnisse in der Programmierung

Erfahrung mit Scala, Java oder Python

Grundlegendes Verständnis von Datenbanken und SQL

Basiswissen in der Datenverarbeitung

Trainingsumgebung

Praktische Übungen mit Apache Spark-Clustern

Umfangreiche Trainingsunterlagen und Code-Beispiele

Organisatorisches

Täglich von 9:00 bis 18:00 Uhr, inklusive Pausen

Schulungssprache, Materialien in Deutsch und Englisch

Ihr Trainer

Trainer Uli Zellbeck

Uli Zellbeck

Uli ist erfahrener Trainer und verfügt über 25 Jahre Erfahrung in der IT-Branche. Als Senior Data Architect bringt er ein tiefgreifendes Know-how im Aufbau von Datenarchitekturen mit. Seine Expertise erstreckt sich über verschiedene Bereiche der Informationstechnologie, und er hat sich insbesondere auf die Entwicklung fortschrittlicher Datenlösungen on Premise und in der Cloud spezialisiert.

Die Teilnehmer können von seinem reichen Erfahrungsschatz profitieren, während er praxisnahe Einblicke in die Verarbeitung von großen Datenmengen in Apache Spark zeigt. In den letzten Jahren hat er mehrere große Spark-Projekte implementiert und betreut, darunter:

  • Implementation von Enterprise Spark-Clustern für Big Data-Verarbeitung
  • Entwicklung von Spark-Anwendungen für Echtzeitdatenverarbeitung
  • Integration von Spark mit verschiedenen Datenquellen und -senken
  • Optimierung von Spark-Jobs für Performance und Skalierbarkeit
  • Machine Learning-Pipelines mit MLlib und Spark ML

Seine praktische Expertise umfasst das gesamte Spektrum von Apache Spark - von der Grundkonfiguration über die Entwicklung komplexer Anwendungen bis hin zur Performance-Optimierung und dem Production-Deployment.

Verfügbare Termine

In-House Training

Umfassende Einführung in die Datenverarbeitung und -analyse mit Apache Spark.

Wir bieten dieses Training als In-House Schulung an, angepasst an Ihre Bedürfnisse. Termine und Konditionen sprechen wir gerne individuell mit Ihnen ab.

Dauer: 3 Tage
Bis zu 10 Teilnehmende
Bei Ihnen vor Ort oder Remote
ab 5.990 € zzgl. MwSt.

Unsere Partner

Linuxhotel Logo

Öffentliche Termine

24.11.2024

Linuxhotel Essen
Buchen

Buche das Training direkt im Terminal

~$

Weitere passende Trainings

Vertiefen Sie Ihr Wissen mit unseren praxisorientierten Big Data und Data Engineering-Schulungen

Datenmodellierung und Architekturen

2 Tage

Datenmodellierung und Architekturen Training: Lernen Sie fortgeschrittene Konzepte für skalierbare und effiziente Datenstrukturen.

  • Verschiedene Datenmodellierungsansätze verstehen
  • Relationale und NoSQL-Modelle vergleichen
  • Datenqualität und -integrität sicherstellen

dbt

2 - 4 Tage

Praxisnahes dbt-Training: Beherrschen Sie SQL-Transformationen, Testing und CI/CD für nachhaltige Analytics-Engineering-Prozesse.

  • dbt Projekte aufsetzen und strukturieren
  • Datenmodelle mit SQL und dbt entwickeln
  • Tests für Datenqualität implementieren

Modern Data Warehouse

3 Tage

Modern Data Warehouse Training: Konzipieren und implementieren Sie skalierbare Cloud-Datenplattformen mit modernsten Technologien.

  • Moderne DWH-Architekturen konzipieren
  • Cloud-basierte Data Warehouse implementieren
  • ELT-Prozesse mit dbt aufbauen