Struttura del corso

Panoramica dei Big Data:

  • Che cos'è Big Data
  • Perché Big Data sta guadagnando popolarità
  • Big Data Casi di studio
  • Big Data Caratteristiche
  • Soluzioni su cui lavorare Big Data.

Hadoop e i suoi componenti:

  • Che cos'è Hadoop e quali sono i suoi componenti.
  • Hadoop Architettura e sue caratteristiche di Dati che può gestire /Process.
  • Cenni su Hadoop Storia, aziende che lo utilizzano e perché hanno iniziato a usarlo.
  • Hadoop Telaio e suoi componenti, spiegati in dettaglio.
  • Che cos'è HDFS e legge -scrive su Hadoop file system distribuito.
  • Come configurare Hadoop Cluster in diverse modalità: cluster autonomo/pseudo/multinodo.

(Ciò include la configurazione di un cluster Hadoop in VirtualBox/KVM/VMware, le configurazioni di rete che devono essere esaminate attentamente, l'esecuzione di Hadoop Daemons e il test del cluster).

  • Che cos'è il frame work Map Reduce e come funziona.
  • Esecuzione di processi Map Reduce nel cluster Hadoop.
  • Comprendere la replica, il mirroring e la consapevolezza del rack nel contesto di Hadoop cluster.

Hadoop Pianificazione del cluster:

  • Come pianificare il cluster Hadoop.
  • Comprendere l'hardware-software per pianificare il cluster Hadoop.
  • Comprendere i carichi di lavoro e pianificare il cluster per evitare errori e prestazioni ottimali.

Che cos'è MapR e perché MapR :

  • Panoramica di MapR e della sua architettura.
  • Comprensione e funzionamento del sistema di controllo MapR, dei volumi MapR, delle istantanee e dei mirror.
  • Pianificazione di un cluster nel contesto di MapR.
  • Confronto di MapR con altre distribuzioni e Apache Hadoop.
  • Installazione di MapR e distribuzione di cluster.

Configurazione e amministrazione del cluster:

  • Gestione di servizi, nodi, snapshot, volumi mirror e cluster remoti.
  • Comprensione e gestione dei nodi.
  • Comprensione di Hadoop componenti, Installazione di Hadoop componenti insieme a MapR Services.
  • Accesso ai dati sul cluster, anche tramite NFS, gestione di servizi e nodi.
  • Gestione dei dati tramite l'utilizzo di volumi, gestione di utenti e gruppi, gestione e assegnazione di ruoli ai nodi, messa in servizio, rimozione delle autorizzazioni dei nodi, amministrazione del cluster e monitoraggio delle prestazioni, configurazione/analisi e monitoraggio delle metriche per monitorare le prestazioni, configurazione e amministrazione della sicurezza MapR.
  • Comprensione e utilizzo dell'archiviazione nativa M7 per le tabelle MapR.
  • Configurazione e ottimizzazione del cluster per prestazioni ottimali.

Aggiornamento del cluster e integrazione con altre configurazioni:

  • Aggiornamento della versione software di MapR e tipi di aggiornamento.
  • Configurazione del cluster Mapr per l'accesso al cluster HDFS.
  • Configurazione del cluster MapR su Amazon Elastic Mapreduce.

Tutti gli argomenti di cui sopra includono dimostrazioni e sessioni di pratica per consentire agli studenti di avere un'esperienza pratica della tecnologia.

Requisiti

  • Conoscenza di base di Linux FS
  • Java di base
  • Conoscenza di Apache Hadoop (consigliato)
 28 ore

Numero di Partecipanti



Prezzo per Partecipante

Recensioni (1)

Corsi relativi

Categorie relative