Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Struttura del corso
Big Data Panoramica:
- Che cos'è Big Data
- Perché Big Data sta guadagnando popolarità
- Big Data Casi di studio
- Big Data Caratteristiche
- Soluzioni su cui lavorare Big Data.
Hadoop e i suoi componenti:
- Che cos'è Hadoop e quali sono i suoi componenti.
- Hadoop Architettura e le sue caratteristiche di Dati che può gestire /Process.
- Breve descrizione Hadoop della storia, delle aziende che lo utilizzano e del motivo per cui hanno iniziato a utilizzarlo.
- Hadoop Telaio e suoi componenti, spiegati in dettaglio.
- Che cos'è HDFS e le letture -scritture su Hadoop file system distribuito.
- Come configurare Hadoop Cluster in diverse modalità: Stand-alone/Pseudo/Multi Node cluster.
(Ciò include la configurazione di un cluster Hadoop in VirtualBox/KVM/VMware, le configurazioni di rete che devono essere esaminate attentamente, l'esecuzione di Hadoop Demoni e il test del cluster).
- Che cos'è Map Reduce frame work e come funziona.
- Esecuzione dei processi Map Reduce nel cluster Hadoop.
- Comprensione della replica, del mirroring e della consapevolezza dei rack nel contesto dei cluster Hadoop.
Hadoop Pianificazione dei cluster:
- Come pianificare il cluster Hadoop.
- Comprensione dell'hardware-software per pianificare il cluster Hadoop.
- Comprensione dei carichi di lavoro e pianificazione del cluster per evitare errori ed eseguire prestazioni ottimali.
Cos'è MapR e perché MapR :
- Panoramica di MapR e della sua architettura.
- Comprensione e funzionamento del sistema di controllo MapR, dei volumi MapR, delle istantanee e dei mirror.
- Pianificazione di un cluster nel contesto di MapR.
- Confronto di MapR con altre distribuzioni e Apache Hadoop.
- Installazione di MapR e distribuzione del cluster.
Configurazione e amministrazione del cluster:
- Gestione di servizi, nodi, snapshot, volumi mirror e cluster remoti.
- Comprensione e gestione dei nodi.
- Comprensione di Hadoop componenti, Installazione di Hadoop componenti insieme ai servizi MapR.
- AccessInvio di dati sul cluster, anche tramite NFS, gestione dei servizi e dei nodi.
- Gestione dei dati utilizzando i volumi, gestione di utenti e gruppi, gestione e assegnazione di ruoli ai nodi, messa in servizio, dismissione dei nodi, amministrazione dei cluster e monitoraggio delle prestazioni, configurazione/analisi e monitoraggio delle metriche per monitorare le prestazioni, configurazione e amministrazione della sicurezza MapR.
- Informazioni e utilizzo dell'archiviazione nativa M7 per le tabelle MapR.
- Configurazione e ottimizzazione del cluster per prestazioni ottimali.
Aggiornamento del cluster e integrazione con altre configurazioni:
- Aggiornamento della versione del software di MapR e tipi di aggiornamento.
- Configurazione del cluster Mapr per l'accesso al cluster HDFS.
- Configurazione del cluster MapR su Amazon Elastic Mapreduce.
Tutti gli argomenti di cui sopra includono dimostrazioni e sessioni pratiche per consentire agli studenti di avere un'esperienza pratica della tecnologia.
Requisiti
- Conoscenza di base di Linux FS
- Base Java
- Conoscenza di Apache Hadoop (consigliato)
28 ore
Recensioni (1)
practical things of doing, also theory was served good by Ajay