Struttura del corso

  • Sezione 1: Introduzione a Big Data & NoSQL
    • Ecosistema del Big Data
    • Panoramica di NoSQL
    • Teorema CAP
    • Quando è appropriato usare NoSQL
    • Archiviazione colonnare
    • HBase e NoSQL
  • Sezione 2: Introduzione a HBase
    • Concetti e progettazione
    • Architettura (HMaster e Region Server)
    • Integrità dei dati
    • Ecosistema HBase
    • Laboratorio: Esplorazione di HBase
  • Sezione 3: Modello dei dati in HBase
    • Spazi dei nomi, tabelle e regioni
    • Righe, colonne, famiglie di colonne, versioni
    • HBase Shell e comandi amministrativi
    • Laboratorio: HBase Shell
  • Sezione 3: Accesso a HBase tramite Java API
    • Introduzione alla Java API
    • Percorso di lettura / scrittura
    • Dati di serie temporale
    • Scans
    • MapReduce
    • Filtri
    • Contatori
    • Coprocessori
    • Laboratori (multipli): Uso della Java API HBase per implementare dati di serie temporale, MapReduce, filtri e contatori.
  • Sezione 4: Progettazione dello schema in HBase: Sessione di gruppo
    • Gli studenti sono presentati con casi di utilizzo reali
    • Gli studenti lavorano in gruppi per elaborare soluzioni di progettazione
    • Discutono, criticano e imparano da diverse progettazioni
    • Laboratorio: Implementare uno scenario in HBase
  • Sezione 5: Interni di HBase
    • Comprensione dei meccanismi interni di HBase
    • Memfile / HFile / WAL
    • Archiviazione HDFS
    • Compaction
    • Splits
    • Filtri Bloom
    • Caches
    • Diagnostics
  • Sezione 6: Installazione e configurazione di HBase
    • Selezione dell'hardware
    • Metodi di installazione
    • Configurazioni comuni
    • Laboratorio: Installazione di HBase
  • Sezione 7: Ecosistema HBase
    • Sviluppo di applicazioni utilizzando HBase
    • Interazione con altri componenti dello stack Hadoop (MapReduce, Pig, Hive)
    • Framework attorno a HBase
    • Concetti avanzati (coprocessori)
    • Laboratorio: Scrittura di applicazioni HBase
  • Sezione 8: Monitoraggio e best practices
    • Strumenti e pratiche di monitoraggio
    • Ottimizzazione di HBase
    • HBase nel cloud
    • Casi di utilizzo reali di HBase
    • Laboratorio: Controllo delle vitalità di HBase

Requisiti

  • conoscenza del linguaggio di programmazione Java
  • comodità con il linguaggio di programmazione Java (navigare nella riga di comando Linux, modificare file con vi / nano)
  • un IDE Java come Eclipse o IntelliJ

Ambiente laboratorio:

Verrà fornito un cluster HBase funzionante per gli studenti. Gli studenti avranno bisogno di un client SSH e di un browser per accedere al cluster.

Installazione Zero: Non è necessario installare il software HBase sulle macchine degli studenti!

 21 Ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (5)

Corsi in Arrivo

Categorie relative