Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.
Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.
Struttura del corso
Big Data Panoramica:
- Cosa è Big Data
- Perché Big Data sta guadagnando popolarità
- Studi di caso su Big Data
- Caratteristiche di Big Data
- Soluzioni da utilizzare con Big Data.
Hadoop e i suoi componenti:
- Cosa è Hadoop e quali sono i suoi componenti.
- Architettura di Hadoop e le caratteristiche dei dati che può gestire/processare.
- Breve introduzione alla storia di Hadoop, alle aziende che lo utilizzano e perché hanno iniziato a farlo.
- Quadro di riferimento del framework di Hadoop e dei suoi componenti - spiegati in dettaglio.
- Cosa è HDFS e le operazioni di lettura/scrittura nel sistema di file distribuito Hadoop.
- Come configurare un cluster Hadoop in diversi modi - Singolo nodo/Pseudodistribuito/Multi-nodo.
(Questo include la configurazione di un cluster Hadoop su VirtualBox/KVM/VMware, le configurazioni di rete che devono essere esaminate attentamente, l'esecuzione dei daemon di Hadoop e il test del cluster).
- Cosa è il framework MapReduce e come funziona.
- Esecuzione di lavori MapReduce su un cluster Hadoop.
- Comprensione della replicazione, mirroring e awareness rack nel contesto dei cluster Hadoop.
Pianificazione del cluster Hadoop:
- Come pianificare il proprio cluster hadoop.
- Comprensione di hardware e software per pianificare il proprio cluster hadoop.
- Comprensione dei carichi di lavoro e la pianificazione del cluster per evitare guasti ed ottenere prestazioni ottimali.
Cosa è MapR e perché utilizzare MapR:
- Panoramica di MapR e della sua architettura.
- Comprensione e funzionamento del sistema di controllo MapR, dei volumi MapR, snapshots e mirror.
- Pianificazione di un cluster nel contesto di MapR.
- Confronto tra MapR e altre distribuzioni e Apache Hadoop.
- Installazione di MapR e deploy del cluster.
Configurazione e amministrazione del cluster:
- Gestione dei servizi, nodi, snapshot, volumi mirror e cluster remoti.
- Comprensione e gestione dei nodi.
- Comprensione dei componenti Hadoop, installazione di componenti Hadoop insieme ai servizi MapR.
- Caricamento dati sul cluster, incluso tramite NFS. Gestione dei servizi e nodi.
- Gestione dei dati utilizzando volumi, gestione di utenti e gruppi, assegnazione di ruoli ai nodi, commissioning e decommissioning dei nodi, amministrazione del cluster e monitoraggio delle prestazioni, configurazione/analisi e monitoraggio delle metriche per il controllo delle prestazioni, configurazione e gestione della sicurezza MapR.
- Comprensione e utilizzo di M7 - storage nativo per le tabelle MapR.
- Configurazione e ottimizzazione del cluster per ottenere prestazioni ottimali.
Aggiornamento del cluster e integrazione con altre configurazioni:
- Aggiornamento della versione software di MapR e tipi di aggiornamento.
- Configurazione del cluster Mapr per accedere al cluster HDFS.
- Configurazione del cluster MapR su Amazon Elastic Mapreduce.
Tutti i punti sopra menzionati includono dimostrazioni e sessioni pratiche per permettere ai partecipanti di ottenere esperienza pratica con la tecnologia.
Requisiti
- Conoscenze di base di Linux FS
- Conoscenza di base di Java
- Conoscenze di Apache Hadoop (raccomandato)
28 Ore
Recensioni (1)
practical things of doing, also theory was served good by Ajay