Struttura del corso
Introduzione
Panoramica degli approcci di accesso ai dati (Hive, database, ecc.)
Panoramica delle caratteristiche e dell'architettura di Spark
Installazione e configurazione di Spark
Comprendere i DataFrame in Spark
Definizione di tabelle e importazione di set di dati
Esecuzione di query su DataFrame utilizzando SQL
Esecuzione di aggregazioni, JOINs e query annidate
Caricamento e accesso ai dati
Esecuzione di query su diversi tipi di dati
- JSON, Parquet, ecc.
Esecuzione di query sui Data Lake con SQL
Risoluzione dei problemi
Riassunto e conclusioni
Requisiti
- Esperienza con query SQL
- Conoscenze di programmazione in qualsiasi linguaggio
Pubblico Obiettivo
- Analisti dei dati
- Data scientists
- Data engineers
Recensioni (3)
Mi è piaciuto che fosse pratico. Ho adorato applicare le conoscenze teoriche con esempi pratici.
Aurelia-Adriana - Allianz Services Romania
Corso - Python and Spark for Big Data (PySpark)
Traduzione automatica
Il fatto che siamo riusciti a portare con noi la maggior parte delle informazioni, dei corsi, delle presentazioni e degli esercizi svolti, in modo da poterli rivisitare e magari ripetere ciò che non abbiamo capito la prima volta o migliorare ciò che abbiamo già fatto.
Raul Mihail Rat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
Traduzione automatica
molto interattivo...
Richard Langford
Corso - SMACK Stack for Data Science
Traduzione automatica