Struttura del corso
Componenti Avanzati per la Costruzione delle Trasformazioni
- Lavorare con tipi di dati complessi
- Gestire campi, metadati e strutture dinamiche
- Modelli riutilizzabili per le trasformazioni
Parametri, Variabili e Progettazione Orientata ai Job
- Variabili di runtime e ambito delle variabili
- Parametrizzazione delle trasformazioni
- Strutture job padre-figlio
Integrazione con Database e Strategie di Lookup
- Passaggi di lookup avanzati
- Strategie di caching
- Progettazione efficiente delle join
Lavorare con File, API e Sistemi Esterni
- Elaborazione di JSON e XML
- Chiamate a servizi REST e SOAP
- Carichi streaming e batch
Gestione degli Errori e Tecniche di Qualità dei Dati
- Catturare e routare gli errori
- Modelli di validazione dei dati
- Auditing e logging
Fondamenti dell'Ottimizzazione delle Prestazioni
- Ottimizzazione della progettazione dei passaggi
- Considerazioni su memoria e threading
- Rilevamento delle criticità
Introduzione allo Sviluppo Basato sul Repository
- Utilizzo del repository Pentaho
- Gestione delle versioni
- Pratiche di collaborazione di team
Pratiche di Distribuzione e Migrazione
- Promozione dei job tra ambienti
- Gestione della configurazione
- Best practice operative
Riepilogo e Prossimi Passi
Requisiti
- Comprensione dei principi fondamentali ETL
- Esperienza con Pentaho Data Integration
- Conoscenze di base sui concetti di data warehousing
Pubblico Obiettivo
- Sviluppatori ETL
- Ingegneri dati
- Professionisti tecnici che espandono le proprie competenze PDI
Recensioni (2)
Very useful in because it helps me understand what we can do with the data in our context. It will also help me
Nicolas NEMORIN - Adecco Groupe France
Corso - KNIME Analytics Platform for BI
It's a hands-on session.