Grazie per aver inviato la vostra richiesta! Un membro del nostro team vi contatterà a breve.
Grazie per aver inviato la vostra prenotazione! Un membro del nostro team vi contatterà a breve.
Struttura del corso
Sezione 1: Introduzione a Hadoop
- Hadoop Storia, Concetti
- SISTEMA ECOLOGICO
- Distribuzioni
- Architettura di alto livello
- Miti di Hadoop
- Sfide Hadoop
- Hardware / Software
- Laboratorio : Primo sguardo a Hadoop
Sezione 2: HDFS
- Design e architettura
- concetti (scalabilità orizzontale, replica, localizzazione dei dati, consapevolezza dei rack)
- Demoni : Nodo dei nomi, Nodo dei nomi secondario,Nodo dei dati
- Comunicazioni / Battiti cardiaci
- Integrità dei dati
- Percorso di lettura/scrittura
- Namenode High Availability (HA), Federazione
- labs : Interazione con HDFS
Sezione 3 : Riduci mappa
- Concetti e architettura
- demoni (MRV1) : jobtracker / tasktracker
- Fasi : Driver, Mapper, Shuffle/Sort, Reducer
- Riduci mappa versione 1 e versione 2 (YARN)
- Componenti interni di Map Reduce
- Introduzione al programma Java Map Reduce
- labs : Esecuzione di un programma MapReduce di esempio
Sezione 4 : Suino
- pig vs java mappa ridurre
- Flusso di lavoro dei suini
- maiale lingua latina
- ETL con Maiale
- Trasformazioni e join
- Funzioni definite dall'utente (UDF)
- labs: scrittura di script Pig per l'analisi dei dati
Sezione 5: Hive
- Architettura e design
- Tipi di dati
- SQL supporto in Hive
- Creazione di tabelle Hive e esecuzione di query
- Partizioni
- Unisce
- Elaborazione del testo
- laboratori : vari laboratori sull'elaborazione dei dati con Hive
Sezione 6: HBase
- Concetti earchitettura
- hbase contro RDBMS contro cassandra
- HBase Java API
- Dati delle serie temporali su HBase
- Progettazione dello schema
- labs: Interagire con HBase usando la shell; programmazione in HBase Java API ; Esercizio di progettazione dello schema
Requisiti
- dimestichezza con il linguaggio di programmazione Java (la maggior parte degli esercizi di programmazione sono in java) Comodo in Linux
- ambiente (essere in grado di navigare Linux riga di comando, modificare i file usando vi / nano)
Ambiente di laboratorio
Zero Install : Non è necessario installare il software hadoop sulle macchine degli studenti! Per gli studenti verrà fornito un cluster hadoop funzionante.
Gli studenti avranno bisogno di quanto segue
- un client SSH (Linux e Mac hanno già client ssh, per Windows Putty è consigliato)
- Un browser per accedere al cluster. Consigliamo il browser Firefox
28 ore
Recensioni (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Corso - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Corso - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay