Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.
Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.
Struttura del corso
Fondamenti di Data-Intensive Platform Engineering
- Introduzione alle applicazioni ad alta intensità di dati
- Sfide nell'ingegneria delle piattaforme per i big data
- Cenni preliminari sulle architetture di elaborazione dei dati
Modellazione dei dati e Management
- Principi di modellazione dei dati per la scalabilità
- Opzioni di archiviazione e ottimizzazione dei dati
- Gestione del ciclo di vita dei dati in un ambiente distribuito
Big Data Quadri di elaborazione
- Panoramica degli strumenti per l'elaborazione dei big data (Hadoop, Spark, Flink)
- Elaborazione batch vs. elaborazione in streaming
- Impostazione di una pipeline di elaborazione dei Big Data
Piattaforme di analisi in tempo reale
- Progettazione per l'analisi in tempo reale
- Motori di elaborazione del flusso (Flussi di Kafka, Apache Storm)
- Creazione di dashboard e visualizzazioni in tempo reale
Orchestrazione della pipeline di dati
- Gestione del flusso di lavoro con Apache Airflow e altri
- Automatizzare le pipeline di dati per l'efficienza
- Monitoraggio e avvisi per le pipeline di dati
Sicurezza e conformità della piattaforma
- Best practice di sicurezza per le piattaforme di dati
- Garantire la privacy dei dati e la conformità alle normative
- Implementazione di controlli di accesso ai dati sicuri
Ottimizzazione e ottimizzazione delle prestazioni
- Tecniche per l'ottimizzazione della velocità effettiva e della latenza dei dati
- Strategie di scalabilità per piattaforme ad alta intensità di dati
- Benchmarking e monitoraggio delle prestazioni
Casi di studio e best practice
- Analisi delle implementazioni di successo della piattaforma dati
- Lezioni apprese dai leader del settore
- Tendenze emergenti nell'ingegneria delle piattaforme ad alta intensità di dati
Progetto Capstone
- Progettazione di una soluzione di piattaforma per un'applicazione ad alta intensità di dati
- Implementazione di un prototipo della pipeline di elaborazione dei dati
- Valutazione delle prestazioni e della scalabilità della piattaforma
Riepilogo e prossime tappe
Requisiti
- Comprensione delle strutture dati e degli algoritmi di base
- Esperienza con la programmazione Java, Scala o Python
- Familiarità con i concetti di base delle basi di dati e SQL
Pubblico
- Sviluppatori di software
- Ingegneri dei dati
- Cavi tecnici
21 Ore