Struttura del corso
Sezione 1: Introduzione ai Big Data / NoSQL
NoSQL panoramica
Teorema CAP
Quando è NoSQL appropriato
Archiviazione colonnare
NoSQL ecosistema
Sezione 2 : Cassandra Nozioni di base
Design e architettura
Cassandra Nodi, cluster, datacenter
Spazi chiave, tabelle, righe e colonne
Partizionamento, replica, token
Quorum e livelli di coerenza
Laboratori: interagire con cassandra utilizzando CQLSH
Sezione 3: Modellazione dei dati – parte 1
introduzione a CQL
Tipi di dati CQL
Creazione di keyspace e tabelle
Scelta di colonne e tipi
Scelta delle chiavi primarie
Layout dei dati per righe e colonne
Tempo di vita (TTL)
Esecuzione di query con CQL
Aggiornamenti CQL
Collezioni (lista / mappa / set)
Laboratori: varie esercitazioni di modellazione dei dati utilizzando CQL; Sperimentazione con le query e i tipi di dati supportati
Sezione 4: Modellazione dei dati – parte 2
Creazione e utilizzo di indici secondari
Chiavi composte (chiavi di partizione e chiavi di clustering)
Dati delle serie temporali
Procedure consigliate per i dati delle serie temporali
Contatori
Transazioni leggere (LWT)
Laboratori: creazione e utilizzo di indici; Modellazione dei dati delle serie temporali
Sezione 5 : Laboratori di modellazione dei dati : Sessione di progettazione di gruppo
Vengono presentati più casi d'uso da vari domini
Gli studenti lavorano in gruppo per elaborare progetti e modelli
Discutere vari progetti, analizzare le decisioni
Lab : implementare uno degli scenari
Sezione 6: Conducenti di Cassandra
Introduzione al driver Java
Operazioni CRUD (Create/Read/Update, Delete) utilizzando il client Java
Query asincrone
Laboratori: utilizzo di Java API per Cassandra
Sezione 7 : Cassandra Interni
Comprendere Cassandra il design sotto il cofano
sstables, memtables, log di commit
Percorso di lettura / Percorso di scrittura
Memorizzazione nella cache
vnodes
Sezione 8: Amministrazione
Selezione dell'hardware
Cassandra distribuzioni
Installazione Cassandra
Esecuzione di benchmark
Strumenti per il monitoraggio delle prestazioni e delle attività dei nodi
DataStax OpsCenter
Diagnosi Cassandra dei problemi di prestazioni
Analisi di un arresto anomalo di un nodo
Informazioni sulla riparazione, l'eliminazione e la replica dei dati
Altri strumenti e suggerimenti per la risoluzione dei problemi
Cassandra Procedure consigliate (compattazione, garbage collection,)
Sezione 9: Laboratorio bonus (tempo permettendo)
Implementa un servizio musicale come Pandora / Spotify su Cassandra
Requisiti
- a proprio agio con il linguaggio di programmazione Java
- A suo agio in ambiente Linux (navigazione da riga di comando, modifica di file con VI / Nano)
Ambiente di laboratorio:
Verrà fornito un ambiente di lavoro Cassandra per gli studenti. Gli studenti avrebbero bisogno di un client SSH e di un browser per accedere al cluster.
Zero Install : Non è necessario installare Cassandra sulle macchine degli studenti!