Struttura del corso
Introduzione
- Panoramica delle funzionalità e dell'architettura di Spark e Hadoop
- Comprendere i big data
- Python Nozioni di base sulla programmazione
Introduttiva
- Configurazione di Python, Spark e Hadoop
- Comprendere le strutture dati in Python
- Comprensione dell'API PySpark
- Informazioni su HDFS e MapReduce
Integrazione di Spark e Hadoop con Python
- Implementazione di Spark RDD in Python
- Elaborazione dei dati tramite MapReduce
- Creazione di set di dati distribuiti in HDFS
Machine Learning con Spark MLlib
Elaborazione Big Data con Spark Streaming
Utilizzo dei sistemi di raccomandazione
Utilizzo di Kafka, Sqoop, Kafka e Flume
Apache Mahout con Spark e Hadoop
Risoluzione dei problemi
Riepilogo e passaggi successivi
Requisiti
- Esperienza con Spark e Hadoop
- Python Esperienza di programmazione
Pubblico
- Scienziati dei dati
- Gli sviluppatori
Recensioni (3)
Il fatto che siamo riusciti a portare con noi la maggior parte delle informazioni, dei corsi, delle presentazioni e degli esercizi svolti, in modo da poterli rivisitare e magari ripetere ciò che non abbiamo capito la prima volta o migliorare ciò che abbiamo già fatto.
Raul Mihail Rat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
Traduzione automatica
Mi è piaciuto che sia riuscito a stabilire le basi dell'argomento e ad arrivare a esercizi abbastanza avanzati. Ha anche fornito modi semplici per scrivere e testare il codice.
Ionut Goga - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
Traduzione automatica
Gli esempi dal vivo
Ahmet Bolat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
Traduzione automatica