Struttura del corso

Introduzione a Google Colab e Apache Spark

  • Panoramica di Google Colab
  • Introduzione a Apache Spark
  • Configurazione di Spark in Google Colab

Elaborazione dei Dati con Apache Spark

  • Lavoro con RDDs e DataFrames
  • Caricamento e elaborazione di grandi set di dati
  • Uso di Spark SQL per interrogare dati strutturati

Analisi Avanzate con Spark

  • Apprendimento automatico con Spark MLlib
  • Esecuzione di analisi dei dati in tempo reale
  • Calcolo distribuito con Spark

Visualizzazione e Collaboration in Google Colab

  • Integrare Colab con librerie di visualizzazione popolari
  • Flussi di lavoro collaborativi con i notebook di Colab
  • Condivisione e esportazione dei risultati

Ottimizzazione dei Workflow Big Data

  • Regolazione di Spark per le prestazioni
  • Ottimizzazione dell'uso della memoria e del storage
  • Scalabilità dei workflow per grandi set di dati

Big Data nel Cloud

  • Integrazione di Google Colab con strumenti basati sul cloud
  • Uso del storage in cloud per grandi quantità di dati
  • Lavoro con Spark in ambienti cloud distribuiti

Studi di Caso e Best Practices

  • Rassegna di applicazioni real-world dei grandi set di dati
  • Studi di caso usando Apache Spark e Colab
  • Migliori pratiche per l'analisi dei grandi set di dati

Riepilogo e Passaggi Successivi

Requisiti

  • Conoscenze di base dei concetti della scienza dei dati
  • Familiarità con Apache Spark
  • Competenze in programmazione Python

Pubblico

  • Scienziati dei dati
  • Ingegneri dei dati
  • Ricerca con grandi quantità di dati
 14 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (5)

Corsi in Arrivo

Categorie relative