Struttura del corso

Introduzione

  • Panoramica delle funzionalità e dell'architettura di Spark e Hadoop
  • Comprendere i big data
  • Python Nozioni di base sulla programmazione

Introduttiva

  • Configurazione di Python, Spark e Hadoop
  • Comprendere le strutture dati in Python
  • Informazioni sull'API PySpark
  • Informazioni su HDFS e MapReduce

Integrazione di Spark e Hadoop con Python

  • Implementazione di Spark RDD in Python
  • Elaborazione dei dati con MapReduce
  • Creazione di set di dati distribuiti in HDFS

Machine Learning con Spark MLlib

Elaborazione di Big Data con Spark Streaming

Utilizzo dei sistemi di raccomandazione

Lavorare con Kafka, Sqoop, Kafka e Flume

Apache Mahout con Spark e Hadoop

Risoluzione dei problemi

Riepilogo e prossime tappe

Requisiti

  • Esperienza con Spark e Hadoop
  • Python Esperienza di programmazione

Pubblico

  • Scienziati dei dati
  • Gli sviluppatori
  21 ore
 

Numero di Partecipanti


Data Inizio

Data Fine


Le date sono soggette a disponibilità e si svolgono tra le 09:30 e le 16:30.
I corsi di formazione pubblici richiedono più di 5 partecipanti.

Recensioni (3)

Corsi relativi

Categorie relative