Struttura del corso

Big Data Panoramica:

  • Che cos'è Big Data
  • Perché Big Data sta guadagnando popolarità
  • Big Data Casi di studio
  • Big Data Caratteristiche
  • Soluzioni su cui lavorare Big Data.

Hadoop e i suoi componenti:

  • Che cos'è Hadoop e quali sono i suoi componenti.
  • Hadoop Architettura e le sue caratteristiche di Dati che può gestire /Process.
  • Breve descrizione Hadoop della storia, delle aziende che lo utilizzano e del motivo per cui hanno iniziato a utilizzarlo.
  • Hadoop Telaio e suoi componenti, spiegati in dettaglio.
  • Che cos'è HDFS e le letture -scritture su Hadoop file system distribuito.
  • Come configurare Hadoop Cluster in diverse modalità: Stand-alone/Pseudo/Multi Node cluster.

(Ciò include la configurazione di un cluster Hadoop in VirtualBox/KVM/VMware, le configurazioni di rete che devono essere esaminate attentamente, l'esecuzione di Hadoop Demoni e il test del cluster).

  • Che cos'è Map Reduce frame work e come funziona.
  • Esecuzione dei processi Map Reduce nel cluster Hadoop.
  • Comprensione della replica, del mirroring e della consapevolezza dei rack nel contesto dei cluster Hadoop.

Hadoop Pianificazione dei cluster:

  • Come pianificare il cluster Hadoop.
  • Comprensione dell'hardware-software per pianificare il cluster Hadoop.
  • Comprensione dei carichi di lavoro e pianificazione del cluster per evitare errori ed eseguire prestazioni ottimali.

Cos'è MapR e perché MapR :

  • Panoramica di MapR e della sua architettura.
  • Comprensione e funzionamento del sistema di controllo MapR, dei volumi MapR, delle istantanee e dei mirror.
  • Pianificazione di un cluster nel contesto di MapR.
  • Confronto di MapR con altre distribuzioni e Apache Hadoop.
  • Installazione di MapR e distribuzione del cluster.

Configurazione e amministrazione del cluster:

  • Gestione di servizi, nodi, snapshot, volumi mirror e cluster remoti.
  • Comprensione e gestione dei nodi.
  • Comprensione di Hadoop componenti, Installazione di Hadoop componenti insieme ai servizi MapR.
  • AccessInvio di dati sul cluster, anche tramite NFS, gestione dei servizi e dei nodi.
  • Gestione dei dati utilizzando i volumi, gestione di utenti e gruppi, gestione e assegnazione di ruoli ai nodi, messa in servizio, dismissione dei nodi, amministrazione dei cluster e monitoraggio delle prestazioni, configurazione/analisi e monitoraggio delle metriche per monitorare le prestazioni, configurazione e amministrazione della sicurezza MapR.
  • Informazioni e utilizzo dell'archiviazione nativa M7 per le tabelle MapR.
  • Configurazione e ottimizzazione del cluster per prestazioni ottimali.

Aggiornamento del cluster e integrazione con altre configurazioni:

  • Aggiornamento della versione del software di MapR e tipi di aggiornamento.
  • Configurazione del cluster Mapr per l'accesso al cluster HDFS.
  • Configurazione del cluster MapR su Amazon Elastic Mapreduce.

Tutti gli argomenti di cui sopra includono dimostrazioni e sessioni pratiche per consentire agli studenti di avere un'esperienza pratica della tecnologia.

Requisiti

  • Conoscenza di base di Linux FS
  • Base Java
  • Conoscenza di Apache Hadoop (consigliato)
 28 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (1)

Corsi in Arrivo

Categorie relative