Struttura del corso

Recensione di Apache Airflow Nozioni di base

  • Concetti fondamentali: gruppi di disponibilità del database, attività e operatori
  • Architettura e componenti del flusso d'aria
  • Riepilogo dei casi d'uso e dei flussi di lavoro comuni

Ottimizzazione delle prestazioni del flusso di lavoro

  • Identificazione dei colli di bottiglia nelle tubazioni del flusso d'aria
  • Tecniche di ottimizzazione a livello di attività
  • Utilizzo dei tentativi di attività, del parallelismo e della concorrenza

Gestione delle dipendenze complesse

  • Definizione delle dipendenze dinamiche nei flussi di lavoro
  • Gestione dei flussi di lavoro condizionali e di ramificazione
  • Utilizzo efficace dei gruppi di attività e dei gruppi di disponibilità del database secondari

Funzioni avanzate in Apache Airflow

  • Creazione di operatori e hook personalizzati
  • Implementazione di sensori per trigger esterni
  • Integrazione di servizi e plug-in di terze parti

Scalabilità Apache Airflow Distribuzioni

  • Approcci di ridimensionamento orizzontale e verticale
  • Utilizzo di celery executors per l'esecuzione distribuita
  • Best practice per il dimensionamento in ambienti cloud

Monitoraggio e debug dei flussi di lavoro

  • Configurazione della registrazione e degli avvisi per il monitoraggio del flusso di lavoro
  • Utilizzo dell'interfaccia utente e dell'interfaccia a riga di comando del flusso d'aria per la risoluzione dei problemi
  • Identificazione e risoluzione dei problemi comuni nelle implementazioni Airflow

Messa in sicurezza Apache Airflow

  • Autenticazione e controllo degli accessi in Airflow
  • Protezione dei dati sensibili e delle configurazioni dell'ambiente
  • Implementazione di audit trail per i flussi di lavoro

Aziende Use Cases e best practice

  • Progettazione di flussi di lavoro affidabili per gli ambienti di produzione
  • Sfruttare Airflow per l'ingegneria dei dati e le pipeline ETL
  • Esplorare casi di studio reali di implementazioni scalabili del flusso d'aria

Riepilogo e passaggi successivi

Requisiti

  • Conoscenza di base di Apache Airflow
  • Familiarità con i concetti di programmazione e orchestrazione del flusso di lavoro Python
  • Esperienza nella gestione e distribuzione di applicazioni in ambienti Linux

Pubblico

  • Ingegneri dei dati
  • DevOps professionisti
  • Sviluppatori di software
 21 ore

Numero di Partecipanti


Prezzo per Partecipante

Corsi in Arrivo

Categorie relative