Struttura del corso
Introduzione a Apache Iceberg
- Panoramica di Apache Iceberg
- Importanza e casi d'uso nell'architettura dei dati moderna
- Funzionalità principali e benefici
Concetti Fondamentali
- Formato di tabella e architettura Iceberg
- Confronto con altri formati di tabella
- Partizionamento ed evoluzione dello schema
- Viaggi nel tempo e versionamento dei dati
Configurazione di Apache Iceberg
- Installazione e configurazione
- Integrazione di Iceberg con diversi motori di elaborazione dei dati
- Configurazione di un ambiente Iceberg su una macchina locale
Operazioni Base
- Creazione e gestione di tabelle Iceberg
- Scrittura e lettura da tabelle Iceberg
- Operazioni CRUD di base
Migrazione e Integrazione dei Dati
- Migrazione dei dati da Hive e altri sistemi a Iceberg
- Integrazione con strumenti di Business Intelligence (BI)
- Migrazione di un set di dati di esempio a Iceberg
Ottimizzazione delle Prestazioni
- Tecniche di ottimizzazione delle prestazioni
- Ottimizzazione delle query e degli accessi ai dati
- Ottimizzazione delle prestazioni in Iceberg
Panoramica sulle Funzionalità Avanzate
- Evoluzione della partizione e partizionamento nascosto
- Evoluzione delle tabelle e modifiche dello schema
- Funzionalità di viaggio nel tempo e rollback
- Implementazione di funzionalità avanzate in Iceberg
Riepilogo e Passi Successivi
Requisiti
- Conoscenza dei concetti come tabelle, schemi, partizioni e ingestione di dati
- Conoscenze di base di SQL
Pubblico di destinazione
- Ingegneri dei dati
- Architetti dei dati
- Analisti dei dati
- Sviluppatori software
Recensioni (5)
Gli esempi dal vivo
Ahmet Bolat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
Traduzione automatica
molto interattivo...
Richard Langford
Corso - SMACK Stack for Data Science
Traduzione automatica
Adeguata pratica sul campo, il formatore è competente
Chris Tan
Corso - A Practical Introduction to Stream Processing
Traduzione automatica
Iscriviti per imparare Spark Streaming, Databricks e AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Corso - Apache Spark in the Cloud
Traduzione automatica
compiti di esercitazione
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Corso - Python and Spark for Big Data (PySpark)
Traduzione automatica