Corso di formazione Hadoop Administration on MapR

Struttura del corso

Panoramica dei Big Data:

Che cos'è Big Data
Perché Big Data sta guadagnando popolarità
Big Data Casi di studio
Big Data Caratteristiche
Soluzioni su cui lavorare Big Data.

Hadoop e i suoi componenti:

Che cos'è Hadoop e quali sono i suoi componenti.
Hadoop Architettura e sue caratteristiche di Dati che può gestire /Process.
Cenni su Hadoop Storia, aziende che lo utilizzano e perché hanno iniziato a usarlo.
Hadoop Telaio e suoi componenti, spiegati in dettaglio.
Che cos'è HDFS e legge -scrive su Hadoop file system distribuito.
Come configurare Hadoop Cluster in diverse modalità: cluster autonomo/pseudo/multinodo.

(Ciò include la configurazione di un cluster Hadoop in VirtualBox/KVM/VMware, le configurazioni di rete che devono essere esaminate attentamente, l'esecuzione di Hadoop Daemons e il test del cluster).

Che cos'è il frame work Map Reduce e come funziona.
Esecuzione di processi Map Reduce nel cluster Hadoop.
Comprendere la replica, il mirroring e la consapevolezza del rack nel contesto di Hadoop cluster.

Hadoop Pianificazione del cluster:

Come pianificare il cluster Hadoop.
Comprendere l'hardware-software per pianificare il cluster Hadoop.
Comprendere i carichi di lavoro e pianificare il cluster per evitare errori e prestazioni ottimali.

Che cos'è MapR e perché MapR :

Panoramica di MapR e della sua architettura.
Comprensione e funzionamento del sistema di controllo MapR, dei volumi MapR, delle istantanee e dei mirror.
Pianificazione di un cluster nel contesto di MapR.
Confronto di MapR con altre distribuzioni e Apache Hadoop.
Installazione di MapR e distribuzione di cluster.

Configurazione e amministrazione del cluster:

Gestione di servizi, nodi, snapshot, volumi mirror e cluster remoti.
Comprensione e gestione dei nodi.
Comprensione di Hadoop componenti, Installazione di Hadoop componenti insieme a MapR Services.
Accesso ai dati sul cluster, anche tramite NFS, gestione di servizi e nodi.
Gestione dei dati tramite l'utilizzo di volumi, gestione di utenti e gruppi, gestione e assegnazione di ruoli ai nodi, messa in servizio, rimozione delle autorizzazioni dei nodi, amministrazione del cluster e monitoraggio delle prestazioni, configurazione/analisi e monitoraggio delle metriche per monitorare le prestazioni, configurazione e amministrazione della sicurezza MapR.
Comprensione e utilizzo dell'archiviazione nativa M7 per le tabelle MapR.
Configurazione e ottimizzazione del cluster per prestazioni ottimali.

Aggiornamento del cluster e integrazione con altre configurazioni:

Aggiornamento della versione software di MapR e tipi di aggiornamento.
Configurazione del cluster Mapr per l'accesso al cluster HDFS.
Configurazione del cluster MapR su Amazon Elastic Mapreduce.

Tutti gli argomenti di cui sopra includono dimostrazioni e sessioni di pratica per consentire agli studenti di avere un'esperienza pratica della tecnologia.