Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Struttura del corso
Big Data Panoramica:
- Cosa è Big Data
- Perché Big Data sta guadagnando popolarità
- Studi di caso su Big Data
- Caratteristiche di Big Data
- Soluzioni da utilizzare con Big Data.
Hadoop e i suoi componenti:
- Cosa è Hadoop e quali sono i suoi componenti.
- Architettura di Hadoop e le caratteristiche dei dati che può gestire/processare.
- Breve introduzione alla storia di Hadoop, alle aziende che lo utilizzano e perché hanno iniziato a farlo.
- Quadro di riferimento del framework di Hadoop e dei suoi componenti - spiegati in dettaglio.
- Cosa è HDFS e le operazioni di lettura/scrittura nel sistema di file distribuito Hadoop.
- Come configurare un cluster Hadoop in diversi modi - Singolo nodo/Pseudodistribuito/Multi-nodo.
(Questo include la configurazione di un cluster Hadoop su VirtualBox/KVM/VMware, le configurazioni di rete che devono essere esaminate attentamente, l'esecuzione dei daemon di Hadoop e il test del cluster).
- Cosa è il framework MapReduce e come funziona.
- Esecuzione di lavori MapReduce su un cluster Hadoop.
- Comprensione della replicazione, mirroring e awareness rack nel contesto dei cluster Hadoop.
Pianificazione del cluster Hadoop:
- Come pianificare il proprio cluster hadoop.
- Comprensione di hardware e software per pianificare il proprio cluster hadoop.
- Comprensione dei carichi di lavoro e la pianificazione del cluster per evitare guasti ed ottenere prestazioni ottimali.
Cosa è MapR e perché utilizzare MapR:
- Panoramica di MapR e della sua architettura.
- Comprensione e funzionamento del sistema di controllo MapR, dei volumi MapR, snapshots e mirror.
- Pianificazione di un cluster nel contesto di MapR.
- Confronto tra MapR e altre distribuzioni e Apache Hadoop.
- Installazione di MapR e deploy del cluster.
Configurazione e amministrazione del cluster:
- Gestione dei servizi, nodi, snapshot, volumi mirror e cluster remoti.
- Comprensione e gestione dei nodi.
- Comprensione dei componenti Hadoop, installazione di componenti Hadoop insieme ai servizi MapR.
- Caricamento dati sul cluster, incluso tramite NFS. Gestione dei servizi e nodi.
- Gestione dei dati utilizzando volumi, gestione di utenti e gruppi, assegnazione di ruoli ai nodi, commissioning e decommissioning dei nodi, amministrazione del cluster e monitoraggio delle prestazioni, configurazione/analisi e monitoraggio delle metriche per il controllo delle prestazioni, configurazione e gestione della sicurezza MapR.
- Comprensione e utilizzo di M7 - storage nativo per le tabelle MapR.
- Configurazione e ottimizzazione del cluster per ottenere prestazioni ottimali.
Aggiornamento del cluster e integrazione con altre configurazioni:
- Aggiornamento della versione software di MapR e tipi di aggiornamento.
- Configurazione del cluster Mapr per accedere al cluster HDFS.
- Configurazione del cluster MapR su Amazon Elastic Mapreduce.
Tutti i punti sopra menzionati includono dimostrazioni e sessioni pratiche per permettere ai partecipanti di ottenere esperienza pratica con la tecnologia.
Requisiti
- Conoscenze di base di Linux FS
- Conoscenza di base di Java
- Conoscenze di Apache Hadoop (raccomandato)
28 ore
Recensioni (1)
practical things of doing, also theory was served good by Ajay