Struttura del corso
Introduzione
Panoramica degli approcci di accesso ai dati (Hive, database, ecc.)
Panoramica delle caratteristiche e dell'architettura di Spark
Installazione e configurazione di Spark
Comprendere i DataFrame in Spark
Definizione di tabelle e importazione di set di dati
Esecuzione di query su DataFrame utilizzando SQL
Esecuzione di aggregazioni, JOINs e query annidate
Caricamento e accesso ai dati
Esecuzione di query su diversi tipi di dati
- JSON, Parquet, ecc.
Esecuzione di query sui Data Lake con SQL
Risoluzione dei problemi
Riassunto e conclusioni
Requisiti
- Esperienza con query SQL
- Conoscenze di programmazione in qualsiasi linguaggio
Pubblico Obiettivo
- Analisti dei dati
- Data scientists
- Data engineers
Recensioni (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Corso - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Corso - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Corso - Apache Spark in the Cloud
practice tasks