Struttura del corso

Introduzione

  • Introduzione al Cloud Computing e alle soluzioni Big Data
  • Panoramica delle Funzionalità e dell'Architettura di Apache Hadoop

Configurazione di Hadoop

  • Pianificazione di un cluster Hadoop (on-premise, cloud, ecc.)
  • Selezione del sistema operativo e della distribuzione Hadoop
  • Provisioning delle risorse (hardware, rete, ecc.)
  • Download e installazione del software
  • Dimensionamento del cluster per la flessibilità

Lavorare con HDFS

  • Comprendere il Hadoop Distributed File System (HDFS)
  • Panoramica delle Comandi di Riferimento di HDFS
  • Accesso a HDFS
  • Esecuzione di Operazioni di Base sui File in HDFS
  • Utilizzo di S3 come integrazione a HDFS

Panoramica di MapReduce

  • Comprendere il Flusso dei Dati nel Framework MapReduce
  • Map, Shuffle, Sort e Reduce
  • Demo: Calcolo dei Salari più Elevati

Lavorare con YARN

  • Comprendere la gestione delle risorse in Hadoop
  • Lavorare con ResourceManager, NodeManager e Application Master
  • Scheduling dei job sotto YARN
  • Scheduling per un numero elevato di nodi e cluster
  • Demo: Scheduling dei job

Integrazione di Hadoop con Spark

  • Configurazione dell'archiviazione per Spark (HDFS, Amazon, S3, NoSQL, ecc.)
  • Comprendere i Resilient Distributed Datasets (RDDs)
  • Creazione di un RDD
  • Implementazione di Trasformazioni RDD
  • Demo: Implementazione di un Programma di Ricerca Testuale per Titoli di Film

Gestione di un Cluster Hadoop

  • Monitoraggio di Hadoop
  • Sicurezza di un cluster Hadoop
  • Aggiunta e rimozione di nodi
  • Esecuzione di un benchmark delle prestazioni
  • Ottimizzazione delle prestazioni del cluster Hadoop
  • Pianificazione dei backup, della ripristino e della continuità aziendale
  • Garantire la disponibilità elevata (HA)

Aggiornamento e Migrazione di un Cluster Hadoop

  • Valutazione dei requisiti del carico di lavoro
  • Aggiornamento di Hadoop
  • Spostamento da on-premise al cloud e viceversa
  • Ripristino da errori

Risoluzione dei problemi

Riassunto e Conclusione

Requisiti

  • Esperienza in amministrazione di sistema
  • Conoscenza della riga di comando Linux
  • Comprensione dei concetti di big data

Pubblico Target

  • Amministratori di sistema
  • DBA (Database Administrators)
 35 Ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (5)

Corsi in Arrivo

Categorie relative