Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.
Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.
Struttura del corso
Introduzione
- Panoramica di Databricks e Apache Spark
- Comprensione dell'architettura di Databricks
Inizio rapido
- Configurazione dell'ambiente
- Configurazione e impostazione di Databricks
- Navigazione nell'interfaccia utente di Databricks
- Creazione di un workspace di Databricks
Lavorare con i dati in Databricks
- Connessione a una fonte di dati Apache Spark
- Comprensione delle colonne e dei tipi di dati di base
- Gestione del file system nei Notebook
Gestione dei processi e dei cluster
- Creazione e configurazione di cluster
- Creazione di processi usando i Notebook
- Esecuzione di processi
- Visualizzazione dei processi e dei dettagli del processo
Uso di Delta Lake in Databricks
- Caricamento dati in Delta Lake
- Gestione dei dati in Delta Lake
Sicurezza di Databricks
- Gestione della sicurezza di Databricks
- Gestione del backup e del ripristino
Risoluzione dei problemi
Riepilogo e passi successivi
Requisiti
- Conoscenze di base dell'analisi dei dati
- Conoscenza di Apache Spark
Pubblico di riferimento
- Data Engineers
- Data Scientists
- Sviluppatori
14 Ore