Struttura del corso
Introduzione
Panoramica degli approcci di accesso ai dati (Hive, database, ecc.)
Panoramica delle funzionalità e dell'architettura di Spark
Installazione e configurazione di Spark
Informazioni sui frame di dati in Spark
Definizione di tabelle e importazione di set di dati
Interrogazione dei frame di dati utilizzando SQL
Esecuzione di aggregazioni, join e query nidificate
Caricamento e Accessing dei dati
Esecuzione di query su diversi tipi di dati
- JSON, parquet, ecc.
Esecuzione di query sui data lake con SQL
Risoluzione dei problemi
Riassunto e conclusione
Requisiti
- Esperienza con SQL query
- Esperienza di programmazione in qualsiasi linguaggio
Pubblico
- Analisti di dati
- Scienziati dei dati
- Ingegneri dei dati
Recensioni (5)
Un sacco di esempi pratici, modi diversi di affrontare lo stesso problema, e a volte trucchi non così ovvi su come migliorare la soluzione attuale
Rafal - Nordea
Corso - Apache Spark MLlib
Traduzione automatica
The live examples
Ahmet Bolat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Corso - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Corso - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift