Struttura del corso
Introduzione
Panoramica degli approcci di accesso ai dati (Hive, database, ecc.)
Panoramica delle caratteristiche e dell'architettura di Spark
Installazione e configurazione di Spark
Comprendere i DataFrame in Spark
Definizione di tabelle e importazione di set di dati
Esecuzione di query su DataFrame utilizzando SQL
Esecuzione di aggregazioni, JOINs e query annidate
Caricamento e accesso ai dati
Esecuzione di query su diversi tipi di dati
- JSON, Parquet, ecc.
Esecuzione di query sui Data Lake con SQL
Risoluzione dei problemi
Riassunto e conclusioni
Requisiti
- Esperienza con query SQL
- Conoscenze di programmazione in qualsiasi linguaggio
Pubblico Obiettivo
- Analisti dei dati
- Data scientists
- Data engineers
Recensioni (5)
Gli esempi dal vivo
Ahmet Bolat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
Traduzione automatica
molto interattivo...
Richard Langford
Corso - SMACK Stack for Data Science
Traduzione automatica
Adeguata pratica sul campo, il formatore è competente
Chris Tan
Corso - A Practical Introduction to Stream Processing
Traduzione automatica
Iscriviti per imparare Spark Streaming, Databricks e AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Corso - Apache Spark in the Cloud
Traduzione automatica
compiti di esercitazione
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Corso - Python and Spark for Big Data (PySpark)
Traduzione automatica