Struttura del corso
Introduzione a Google Colab e Apache Spark
- Panoramica di Google Colab
- Introduzione a Apache Spark
- Configurazione di Spark in Google Colab
Elaborazione dei Dati con Apache Spark
- Lavoro con RDDs e DataFrames
- Caricamento e elaborazione di grandi set di dati
- Uso di Spark SQL per interrogare dati strutturati
Analisi Avanzate con Spark
- Apprendimento automatico con Spark MLlib
- Esecuzione di analisi dei dati in tempo reale
- Calcolo distribuito con Spark
Visualizzazione e Collaboration in Google Colab
- Integrare Colab con librerie di visualizzazione popolari
- Flussi di lavoro collaborativi con i notebook di Colab
- Condivisione e esportazione dei risultati
Ottimizzazione dei Workflow Big Data
- Regolazione di Spark per le prestazioni
- Ottimizzazione dell'uso della memoria e del storage
- Scalabilità dei workflow per grandi set di dati
Big Data nel Cloud
- Integrazione di Google Colab con strumenti basati sul cloud
- Uso del storage in cloud per grandi quantità di dati
- Lavoro con Spark in ambienti cloud distribuiti
Studi di Caso e Best Practices
- Rassegna di applicazioni real-world dei grandi set di dati
- Studi di caso usando Apache Spark e Colab
- Migliori pratiche per l'analisi dei grandi set di dati
Riepilogo e Passaggi Successivi
Requisiti
- Conoscenze di base dei concetti della scienza dei dati
- Familiarità con Apache Spark
- Competenze in programmazione Python
Pubblico
- Scienziati dei dati
- Ingegneri dei dati
- Ricerca con grandi quantità di dati
Recensioni (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Corso - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Corso - QGIS for Geographic Information System
Mi è piaciuto lo stile di Pablo, il fatto che abbia trattato molti argomenti, dalla progettazione di report, alla personalizzazione con html all'implementazione di semplici algoritmi ML. Good equilibrio informazioni teoriche / esercizi. Pablo ha davvero coperto tutti gli argomenti che mi interessavano e ha dato risposte esaurienti alle mie domande.
Cristian Tudose - SC Automobile Dacia SA
Corso - Advanced Data Analysis with TIBCO Spotfire
Traduzione automatica
Actual application of spotfire and all basic functions.
Michael Capili - STMicroelectronics, Inc.
Corso - Introduction to Spotfire
The thing I liked the most about the training was the organization and the location