Struttura del corso

Introduzione

  • Panoramica di Databricks e Apache Spark
  • Comprendere l'architettura Databricks

Introduttiva

  • Impostazione dell'ambiente
  • Impostazione e configurazione Databricks
  • Navigazione nell'interfaccia utente Databricks
  • Creazione di un'area di lavoro Databricks

Utilizzo dei dati in Databricks

  • Connessione a un'origine dati Apache Spark
  • Informazioni sulle colonne e sui tipi di dati di base
  • Gestione del file system nei notebook

Gestione di processi e cluster

  • Creazione e configurazione di cluster
  • Creazione di processi con Notebook
  • Processi in esecuzione
  • Visualizzazione dei lavori e dei dettagli dei lavori

Utilizzo di Delta Lake in Databricks

  • Caricamento dei dati in Delta Lake
  • Gestione dei dati in Delta Lake

Messa in sicurezza Databricks

  • Gestione Databricks della sicurezza
  • Gestione del backup e del ripristino

Risoluzione dei problemi

Riepilogo e prossime tappe

Requisiti

  • Conoscenza di base dell'analisi dei dati
  • Conoscenza di Apache Spark

Pubblico

  • Ingegneri dei dati
  • Scienziati dei dati
  • Gli sviluppatori
  14 ore

Numero di Partecipanti



Prezzo per Partecipante

Recensioni (2)

Corsi relativi

Azure for Data Engineer

  35 ore

Data Analysis for Marketers

  14 ore

Categorie relative