Struttura del corso

Introduzione

Comprensione dei dati Big Data

Panoramica di Spark

Panoramica di Python

Panoramica di PySpark

  • Distribuzione dei dati utilizzando il framework Resilient Distributed Datasets (RDD)
  • Distribuzione del calcolo utilizzando gli operatori della Spark API

Configurazione di Python con Spark

Configurazione di PySpark

Utilizzo delle istanze EC2 Amazon Web Services (AWS) per Spark

Configurazione di Databricks

Configurazione del cluster AWS EMR

Idee basilari su Python Programming

  • Inizio con Python
  • Utilizzo dei Jupyter Notebook
  • Uso delle variabili e dei tipi di dati semplici
  • Lavoro con le liste
  • Uso degli statement if
  • Uso delle input dell'utente
  • Lavoro con i cicli while
  • Messa in pratica delle funzioni
  • Lavoro con le classi
  • Lavoro con file e eccezioni
  • Lavoro progetti, dati e API

Idee basilari sui DataFrame di Spark

  • Inizio con i DataFrame di Spark
  • Messa in pratica delle operazioni di base con Spark
  • Utilizzo delle operazioni Groupby e Aggregate
  • Lavoro con timestamp e date

Esercizi progetto sui DataFrame di Spark

Comprensione dei dati Machine Learning con MLlib

Messa in pratica di MLlib, Spark e Python per i dati Machine Learning

Comprensione delle regressioni

  • Apprendimento della teoria della regressione lineare
  • Messa in pratica del codice di valutazione della regressione
  • Esercizi pratici sulla regressione lineare
  • Apprendimento della teoria della regressione logistica
  • Messa in pratica del codice della regressione logistica
  • Esercizi pratici sulla regressione logistica

Comprensione delle Random Forest e degli alberi di decisione

  • Apprendimento della teoria dei metodi degli alberi
  • Messa in pratica degli alberi di decisione e codice Random Forest
  • Esercizi pratici sulla classificazione Random Forest

Lavoro con il clustering K-means

  • Comprensione della teoria del clustering K-means
  • Messa in pratica del codice di clustering K-means
  • Esercizi pratici sul clustering

Lavoro con i sistemi di raccomandazione

Messa in pratica del Processing del Linguaggio Naturale (NLP)

  • Comprensione dei Natural Language Processing (NLP)
  • Panoramica degli strumenti NLP
  • Esercizi pratici di NLP

Streaming con Spark su Python

  • Panoramica del streaming con Spark
  • Esercizio campione Spark Streaming

Osservazioni finali

Requisiti

  • Competenze generali di programmazione

Pubblico

  • Gli sviluppatori
  • Professionisti IT
  • Scienziati dei dati
 21 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (6)

Corsi in Arrivo

Categorie relative