Struttura del corso

Introduzione

  • Panoramica di Databricks e Apache Spark
  • Comprensione dell'architettura di Databricks

Inizio rapido

  • Configurazione dell'ambiente
  • Configurazione e impostazione di Databricks
  • Navigazione nell'interfaccia utente di Databricks
  • Creazione di un workspace di Databricks

Lavorare con i dati in Databricks

  • Connessione a una fonte di dati Apache Spark
  • Comprensione delle colonne e dei tipi di dati di base
  • Gestione del file system nei Notebook

Gestione dei processi e dei cluster

  • Creazione e configurazione di cluster
  • Creazione di processi usando i Notebook
  • Esecuzione di processi
  • Visualizzazione dei processi e dei dettagli del processo

Uso di Delta Lake in Databricks

  • Caricamento dati in Delta Lake
  • Gestione dei dati in Delta Lake

Sicurezza di Databricks

  • Gestione della sicurezza di Databricks
  • Gestione del backup e del ripristino

Risoluzione dei problemi

Riepilogo e passi successivi

Requisiti

  • Conoscenze di base dell'analisi dei dati
  • Conoscenza di Apache Spark

Pubblico di riferimento

  • Data Engineers
  • Data Scientists
  • Sviluppatori
 14 Ore

Numero di Partecipanti


Prezzo per Partecipante

Corsi in Arrivo

Categorie relative