Struttura del corso
Introduzione a Apache Iceberg
- Panoramica di Apache Iceberg
- Importanza e casi d'uso nell'architettura dei dati moderna
- Funzionalità principali e benefici
Concetti Fondamentali
- Formato di tabella e architettura Iceberg
- Confronto con altri formati di tabella
- Partizionamento ed evoluzione dello schema
- Viaggi nel tempo e versionamento dei dati
Configurazione di Apache Iceberg
- Installazione e configurazione
- Integrazione di Iceberg con diversi motori di elaborazione dei dati
- Configurazione di un ambiente Iceberg su una macchina locale
Operazioni Base
- Creazione e gestione di tabelle Iceberg
- Scrittura e lettura da tabelle Iceberg
- Operazioni CRUD di base
Migrazione e Integrazione dei Dati
- Migrazione dei dati da Hive e altri sistemi a Iceberg
- Integrazione con strumenti di Business Intelligence (BI)
- Migrazione di un set di dati di esempio a Iceberg
Ottimizzazione delle Prestazioni
- Tecniche di ottimizzazione delle prestazioni
- Ottimizzazione delle query e degli accessi ai dati
- Ottimizzazione delle prestazioni in Iceberg
Panoramica sulle Funzionalità Avanzate
- Evoluzione della partizione e partizionamento nascosto
- Evoluzione delle tabelle e modifiche dello schema
- Funzionalità di viaggio nel tempo e rollback
- Implementazione di funzionalità avanzate in Iceberg
Riepilogo e Passi Successivi
Requisiti
- Conoscenza dei concetti come tabelle, schemi, partizioni e ingestione di dati
- Conoscenze di base di SQL
Pubblico di destinazione
- Ingegneri dei dati
- Architetti dei dati
- Analisti dei dati
- Sviluppatori software
Recensioni (3)
Mi è piaciuto che fosse pratico. Ho adorato applicare le conoscenze teoriche con esempi pratici.
Aurelia-Adriana - Allianz Services Romania
Corso - Python and Spark for Big Data (PySpark)
Traduzione automatica
Il fatto che siamo riusciti a portare con noi la maggior parte delle informazioni, dei corsi, delle presentazioni e degli esercizi svolti, in modo da poterli rivisitare e magari ripetere ciò che non abbiamo capito la prima volta o migliorare ciò che abbiamo già fatto.
Raul Mihail Rat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
Traduzione automatica
molto interattivo...
Richard Langford
Corso - SMACK Stack for Data Science
Traduzione automatica