Struttura del corso
Introduzione a Apache Spark
- Il ruolo di Spark nell'elaborazione dei big data
- Architettura Spark e relativi componenti
Impostazione Apache Spark
- Requisiti hardware e software
- Procedure di installazione per le modalità autonoma e cluster
- Procedure consigliate per la configurazione per gli amministratori di sistema
Amministrazione di cluster SparkAdadministration Spark Clusters
- Strumenti e tecniche di gestione dei cluster
- Monitoraggio delle applicazioni Spark e delle risorse del cluster
- Configurazioni di sicurezza e gestione degli utenti
Ottimizzazione e ottimizzazione delle prestazioni
- Allocazione e pianificazione delle risorse
- Tuning Spark per prestazioni ottimali
- Identificazione e risoluzione dei colli di bottiglia comuni
Risoluzione dei problemi e risoluzione dei problemi
- Problemi comuni di amministrazione di Spark
- Strumenti diagnostici e tecniche per la risoluzione dei problemi
- Approccio graduale alla risoluzione dei problemi più comuni
- Procedure consigliate per mantenere un ambiente Spark integro
Argomenti relativi all'amministrazione avanzata
- Integrazione con altri strumenti per i big data
- Garantire l'alta disponibilità e il ripristino di emergenza
- Aggiornamento e ridimensionamento dei cluster SparkUpgrading and scaling Spark clusters
Riepilogo e prossime tappe
Requisiti
- Conoscenza di base della configurazione e della gestione della rete
- Familiarità con il sistema operativo Linux e l'interfaccia della riga di comando
- Interesse per l'apprendimento dei sistemi di calcolo distribuito e della gestione dei big data
Pubblico
- Amministratori di sistema
Recensioni (5)
Gli esempi dal vivo
Ahmet Bolat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
Traduzione automatica
molto interattivo...
Richard Langford
Corso - SMACK Stack for Data Science
Traduzione automatica
Adeguata pratica sul campo, il formatore è competente
Chris Tan
Corso - A Practical Introduction to Stream Processing
Traduzione automatica
Iscriviti per imparare Spark Streaming, Databricks e AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Corso - Apache Spark in the Cloud
Traduzione automatica
compiti di esercitazione
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Corso - Python and Spark for Big Data (PySpark)
Traduzione automatica