Struttura del corso
Introduzione a Apache Iceberg
- Panoramica di Apache Iceberg
- Ripasso dei concetti di base
Approfondimento sull'architettura di Iceberg
- Analisi approfondita del formato delle tabelle di Iceberg
- Panoramica dettagliata dell'architettura, inclusi metadati e layout dei file
- Interni dello schema e dell'evoluzione delle partizioni
Installazione e configurazione avanzate
- Configurazione di Iceberg per un'ottimale prestazione in diversi ambienti
- Integrazione con vari motori di elaborazione dei dati
- Configurazione avanzata: sicurezza, crittografia e controlli di accesso
- Configurazione di Iceberg in un ambiente distribuito
Operazioni e manutenzione avanzate
- Gestione delle tabelle Iceberg su larga scala
- Implementazione e gestione di cambiamenti dello schema complessi
- Gestione dell'evoluzione delle partizioni e della partizionamento nascosto
- Operazioni CRUD avanzate con modifiche allo schema e alle partizioni
Tecniche di ottimizzazione delle query
- Tecniche per ridurre la latenza delle query
- Pruning delle partizioni e dei file
- Caching dei metadati e strategie di ottimizzazione
- Implementazione e testing delle tecniche di ottimizzazione delle query
Ottimizzazione delle prestazioni per set di dati su larga scala
- Ottimizzazione delle prestazioni per set di dati su larga scala
- Utilizzo delle funzionalità integrate di Iceberg per l'ottimizzazione delle prestazioni
- Studi di caso sull'ottimizzazione delle prestazioni in scenari reali
- Ottimizzazione delle prestazioni per set di dati su larga scala
Migrazione e integrazione avanzate dei dati
- Migrazione di strutture dati complesse da altri sistemi
- Integrazione di Iceberg con flussi di dati in tempo reale
- Migrazione di set di dati complessi e integrazione di flussi di dati in tempo reale
affidabilità e coerenza
- Garanzia della coerenza e dell'integrità dei dati in ambienti distribuiti
- Implementazione e gestione delle garanzie transazionali
- Gestione degli errori e meccanismi di recupero
- Implementazione di funzionalità di affidabilità e coerenza
Funzionalità avanzate e personalizzazione
- Implementazioni personalizzate del catalogo
- Estensione di Iceberg con funzionalità personalizzate
- Implementazione di un catalogo personalizzato ed estensione delle funzionalità di Iceberg
Governance e conformità dei dati
- Implementazione di politiche di governance dei dati
- Conformità con le regolamentazioni sui dati
- Gestione delle tracce di audit e della genealogia dei dati
- Implementazione di funzionalità di governance e conformità
Riepilogo e passi successivi
Requisiti
- Conoscenza dei concetti di base, delle operazioni fondamentali e della gestione delle tabelle Iceberg
Pubblico di riferimento
- Ingegneri dei dati
- Architetti dei dati
- Analisti dei dati
- Sviluppatori software
Recensioni (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Corso - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Corso - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Corso - Apache Spark in the Cloud
practice tasks