Struttura del corso
Sezione 1: Gestione dei Dati in HDFS
- Diversi Format di Dati (JSON / Avro / Parquet)
- Schemi di Compressione
- Mascheramento dei Dati
- Laboratori : Analisi di diversi formati di dati; attivazione della compressione
Sezione 2: Pig Avanzato
- Funzioni Definite dall'Utente
- Introduzione alle Librerie Pig (ElephantBird / Data-Fu)
- Caricamento di Dati Strutturati Complessi usando Pig
- Ottimizzazione di Pig
- Laboratori : scripting avanzato con Pig, parsing di tipi di dati complessi
Sezione 3: Hive Avanzato
- Funzioni Definite dall'Utente
- Tabelle Comprimibili
- Ottimizzazione delle Prestazioni di Hive
- Laboratori : creazione di tabelle compresse, valutazione dei formati e della configurazione delle tabelle
Sezione 4: HBase Avanzato
- Modellizzazione dello Schema Avanzata
- Compressione
- Ingestione di Dati in Bulk
- Confronto tra Tabelle Larghe e Tabelle Alte
- HBase e Pig
- HBase e Hive
- Ottimizzazione delle Prestazioni di HBase
- Laboratori : ottimizzazione di HBase; accesso ai dati di HBase da Pig & Hive; Utilizzo di Phoenix per la modellazione dei dati
Requisiti
- familiarità con il linguaggio di programmazione Java (la maggior parte degli esercizi di programmazione sono in Java)
- familiarità con l'ambiente Linux (essere in grado di navigare nella riga di comando di Linux, modificare file usando vi / nano)
- conoscenze operative di Hadoop.
Ambiente del laboratorio
Installazione Zero: Non è necessario installare il software Hadoop sulle macchine degli studenti! Un cluster Hadoop funzionante sarà fornito agli studenti.
Gli studenti avranno bisogno di:
Recensioni (5)
Gli esempi dal vivo
Ahmet Bolat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
Traduzione automatica
Durante gli esercizi, James mi ha spiegato ogni passaggio nei dettagli ogni volta che mi bloccavo. Ero completamente nuovo di NiFi. Mi ha illustrato lo scopo reale di NiFi, inclusi i concetti di base come il software open source. Ha coperto ogni aspetto di NiFi, partendo dal livello principiante fino a quello sviluppatore.
Firdous Hashim Ali - MOD A BLOCK
Corso - Apache NiFi for Administrators
Traduzione automatica
Che ce l'avevo sin dall'inizio.
Peter Scales - CACI Ltd
Corso - Apache NiFi for Developers
Traduzione automatica
aspetti pratici dell'azione, ma anche la teoria è stata ben spiegata da Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Corso - Hadoop Administration on MapR
Traduzione automatica
La VM mi è piaciuta molto. L'insegnante era molto competente riguardo l'argomento, nonché altri argomenti, ed era molto gentile e amichevole. Mi è piaciuto il centro a Dubai.
Safar Alqahtani - Elm Information Security
Corso - Big Data Analytics in Health
Traduzione automatica