Struttura del corso

Big Data Panoramica:

  • Cosa è Big Data
  • Perché Big Data sta guadagnando popolarità
  • Studi di caso su Big Data
  • Caratteristiche di Big Data
  • Soluzioni da utilizzare con Big Data.

Hadoop e i suoi componenti:

  • Cosa è Hadoop e quali sono i suoi componenti.
  • Architettura di Hadoop e le caratteristiche dei dati che può gestire/processare.
  • Breve introduzione alla storia di Hadoop, alle aziende che lo utilizzano e perché hanno iniziato a farlo.
  • Quadro di riferimento del framework di Hadoop e dei suoi componenti - spiegati in dettaglio.
  • Cosa è HDFS e le operazioni di lettura/scrittura nel sistema di file distribuito Hadoop.
  • Come configurare un cluster Hadoop in diversi modi - Singolo nodo/Pseudodistribuito/Multi-nodo.

(Questo include la configurazione di un cluster Hadoop su VirtualBox/KVM/VMware, le configurazioni di rete che devono essere esaminate attentamente, l'esecuzione dei daemon di Hadoop e il test del cluster).

  • Cosa è il framework MapReduce e come funziona.
  • Esecuzione di lavori MapReduce su un cluster Hadoop.
  • Comprensione della replicazione, mirroring e awareness rack nel contesto dei cluster Hadoop.

Pianificazione del cluster Hadoop:

  • Come pianificare il proprio cluster hadoop.
  • Comprensione di hardware e software per pianificare il proprio cluster hadoop.
  • Comprensione dei carichi di lavoro e la pianificazione del cluster per evitare guasti ed ottenere prestazioni ottimali.

Cosa è MapR e perché utilizzare MapR:

  • Panoramica di MapR e della sua architettura.
  • Comprensione e funzionamento del sistema di controllo MapR, dei volumi MapR, snapshots e mirror.
  • Pianificazione di un cluster nel contesto di MapR.
  • Confronto tra MapR e altre distribuzioni e Apache Hadoop.
  • Installazione di MapR e deploy del cluster.

Configurazione e amministrazione del cluster:

  • Gestione dei servizi, nodi, snapshot, volumi mirror e cluster remoti.
  • Comprensione e gestione dei nodi.
  • Comprensione dei componenti Hadoop, installazione di componenti Hadoop insieme ai servizi MapR.
  • Caricamento dati sul cluster, incluso tramite NFS. Gestione dei servizi e nodi.
  • Gestione dei dati utilizzando volumi, gestione di utenti e gruppi, assegnazione di ruoli ai nodi, commissioning e decommissioning dei nodi, amministrazione del cluster e monitoraggio delle prestazioni, configurazione/analisi e monitoraggio delle metriche per il controllo delle prestazioni, configurazione e gestione della sicurezza MapR.
  • Comprensione e utilizzo di M7 - storage nativo per le tabelle MapR.
  • Configurazione e ottimizzazione del cluster per ottenere prestazioni ottimali.

Aggiornamento del cluster e integrazione con altre configurazioni:

  • Aggiornamento della versione software di MapR e tipi di aggiornamento.
  • Configurazione del cluster Mapr per accedere al cluster HDFS.
  • Configurazione del cluster MapR su Amazon Elastic Mapreduce.

Tutti i punti sopra menzionati includono dimostrazioni e sessioni pratiche per permettere ai partecipanti di ottenere esperienza pratica con la tecnologia.

Requisiti

  • Conoscenze di base di Linux FS
  • Conoscenza di base di Java
  • Conoscenze di Apache Hadoop (raccomandato)
 28 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (1)

Corsi in Arrivo

Categorie relative