Struttura del corso
Introduzione
- Panoramica delle funzionalità e dell'architettura di Spark e Hadoop
- Comprendere i big data
- Python Nozioni di base sulla programmazione
Introduttiva
- Configurazione di Python, Spark e Hadoop
- Comprendere le strutture dati in Python
- Informazioni sull'API PySpark
- Informazioni su HDFS e MapReduce
Integrazione di Spark e Hadoop con Python
- Implementazione di Spark RDD in Python
- Elaborazione dei dati con MapReduce
- Creazione di set di dati distribuiti in HDFS
Machine Learning con Spark MLlib
Elaborazione di Big Data con Spark Streaming
Utilizzo dei sistemi di raccomandazione
Lavorare con Kafka, Sqoop, Kafka e Flume
Apache Mahout con Spark e Hadoop
Risoluzione dei problemi
Riepilogo e prossime tappe
Requisiti
- Esperienza con Spark e Hadoop
- Python Esperienza di programmazione
Pubblico
- Scienziati dei dati
- Gli sviluppatori
Recensioni (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
The live examples