Struttura del corso
Introduzione a Apache Spark
- Il ruolo di Spark nell'elaborazione dei big data
- Architettura Spark e relativi componenti
Impostazione Apache Spark
- Requisiti hardware e software
- Procedure di installazione per le modalità autonoma e cluster
- Procedure consigliate per la configurazione per gli amministratori di sistema
Amministrazione di cluster SparkAdadministration Spark Clusters
- Strumenti e tecniche di gestione dei cluster
- Monitoraggio delle applicazioni Spark e delle risorse del cluster
- Configurazioni di sicurezza e gestione degli utenti
Ottimizzazione e ottimizzazione delle prestazioni
- Allocazione e pianificazione delle risorse
- Tuning Spark per prestazioni ottimali
- Identificazione e risoluzione dei colli di bottiglia comuni
Risoluzione dei problemi e risoluzione dei problemi
- Problemi comuni di amministrazione di Spark
- Strumenti diagnostici e tecniche per la risoluzione dei problemi
- Approccio graduale alla risoluzione dei problemi più comuni
- Procedure consigliate per mantenere un ambiente Spark integro
Argomenti relativi all'amministrazione avanzata
- Integrazione con altri strumenti per i big data
- Garantire l'alta disponibilità e il ripristino di emergenza
- Aggiornamento e ridimensionamento dei cluster SparkUpgrading and scaling Spark clusters
Riepilogo e prossime tappe
Requisiti
- Conoscenza di base della configurazione e della gestione della rete
- Familiarità con il sistema operativo Linux e l'interfaccia della riga di comando
- Interesse per l'apprendimento dei sistemi di calcolo distribuito e della gestione dei big data
Pubblico
- Amministratori di sistema
Recensioni (8)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Corso - Python and Spark for Big Data (PySpark)
Un sacco di esempi pratici, modi diversi di affrontare lo stesso problema, e a volte trucchi non così ovvi su come migliorare la soluzione attuale
Rafał - Nordea
Corso - Apache Spark MLlib
Traduzione automatica
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Corso - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Sufficient hands on, trainer is knowledgable
Chris Tan
Corso - A Practical Introduction to Stream Processing
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Corso - Big Data Analytics in Health
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Corso - Apache Spark in the Cloud
very interactive...
Richard Langford
Corso - SMACK Stack for Data Science
Impegno e disponibilità a spiegare argomenti collaterali.
Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Corso - Apache Spark Fundamentals
Traduzione automatica