Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Struttura del corso
Panoramica dei Big Data:
- Che cos'è Big Data
- Perché Big Data sta guadagnando popolarità
- Big Data Casi di studio
- Big Data Caratteristiche
- Soluzioni su cui lavorare Big Data.
Hadoop e i suoi componenti:
- Che cos'è Hadoop e quali sono i suoi componenti.
- Hadoop Architettura e sue caratteristiche di Dati che può gestire /Process.
- Cenni su Hadoop Storia, aziende che lo utilizzano e perché hanno iniziato a usarlo.
- Hadoop Telaio e suoi componenti, spiegati in dettaglio.
- Che cos'è HDFS e legge -scrive su Hadoop file system distribuito.
- Come configurare Hadoop Cluster in diverse modalità: cluster autonomo/pseudo/multinodo.
(Ciò include la configurazione di un cluster Hadoop in VirtualBox/KVM/VMware, le configurazioni di rete che devono essere esaminate attentamente, l'esecuzione di Hadoop Daemons e il test del cluster).
- Che cos'è il frame work Map Reduce e come funziona.
- Esecuzione di processi Map Reduce nel cluster Hadoop.
- Comprendere la replica, il mirroring e la consapevolezza del rack nel contesto di Hadoop cluster.
Hadoop Pianificazione del cluster:
- Come pianificare il cluster Hadoop.
- Comprendere l'hardware-software per pianificare il cluster Hadoop.
- Comprendere i carichi di lavoro e pianificare il cluster per evitare errori e prestazioni ottimali.
Che cos'è MapR e perché MapR :
- Panoramica di MapR e della sua architettura.
- Comprensione e funzionamento del sistema di controllo MapR, dei volumi MapR, delle istantanee e dei mirror.
- Pianificazione di un cluster nel contesto di MapR.
- Confronto di MapR con altre distribuzioni e Apache Hadoop.
- Installazione di MapR e distribuzione di cluster.
Configurazione e amministrazione del cluster:
- Gestione di servizi, nodi, snapshot, volumi mirror e cluster remoti.
- Comprensione e gestione dei nodi.
- Comprensione di Hadoop componenti, Installazione di Hadoop componenti insieme a MapR Services.
- Accesso ai dati sul cluster, anche tramite NFS, gestione di servizi e nodi.
- Gestione dei dati tramite l'utilizzo di volumi, gestione di utenti e gruppi, gestione e assegnazione di ruoli ai nodi, messa in servizio, rimozione delle autorizzazioni dei nodi, amministrazione del cluster e monitoraggio delle prestazioni, configurazione/analisi e monitoraggio delle metriche per monitorare le prestazioni, configurazione e amministrazione della sicurezza MapR.
- Comprensione e utilizzo dell'archiviazione nativa M7 per le tabelle MapR.
- Configurazione e ottimizzazione del cluster per prestazioni ottimali.
Aggiornamento del cluster e integrazione con altre configurazioni:
- Aggiornamento della versione software di MapR e tipi di aggiornamento.
- Configurazione del cluster Mapr per l'accesso al cluster HDFS.
- Configurazione del cluster MapR su Amazon Elastic Mapreduce.
Tutti gli argomenti di cui sopra includono dimostrazioni e sessioni di pratica per consentire agli studenti di avere un'esperienza pratica della tecnologia.
Requisiti
- Conoscenza di base di Linux FS
- Java di base
- Conoscenza di Apache Hadoop (consigliato)
28 ore
Recensioni (1)
practical things of doing, also theory was served good by Ajay