Struttura del corso

Introduzione

Comprensione Big Data

Panoramica di Spark

Panoramica di Python

Panoramica di PySpark

  • Distribuzione dei dati utilizzando Resilient Distributed Datasets Framework
  • Distribuzione del calcolo tramite gli operatori API Spark

Configurazione Python con Spark

Impostazione PySpark

Utilizzo delle istanze EC2 di Amazon Web Services (AWS) per Spark

Impostazione Databricks

Configurazione del cluster AWS EMR

Imparare le basi della programmazione Python

  • Guida introduttiva a Python
  • Uso del notebook Jupyter
  • Utilizzo di variabili e tipi di dati semplici
  • Utilizzo degli elenchi
  • Utilizzo delle istruzioni if
  • Utilizzo degli input dell'utente
  • Utilizzo dei cicli while
  • Funzioni di implementazione
  • Utilizzo delle classi
  • Utilizzo di file ed eccezioni
  • Utilizzo di progetti, dati e API

Apprendimento delle nozioni di base di Spark DataFrame

  • Introduzione ai frame di dati Spark
  • Implementazione delle operazioni di base con Spark
  • Utilizzo di GroupBy e delle operazioni di aggregazione
  • Utilizzo di timestamp e date

Esercizio di utilizzo di un progetto Spark DataFrame

Informazioni su Machine Learning con MLlib

Uso di MLlib, Spark e Python per Machine Learning

Informazioni sulle regressioni

  • Apprendimento della teoria della regressione lineare
  • Implementazione di un codice di valutazione della regressione
  • Lavorare su un esempio di esercizio di regressione lineare
  • Apprendimento della teoria della regressione logistica
  • Implementazione di un codice di regressione logistica
  • Lavorare su un esempio di esercizio di regressione logistica

Comprendere gli Random Forest e gli alberi decisionali

  • Teoria dei metodi dell'albero di apprendimento
  • Implementazione degli alberi decisionali e dei codici Random Forest
  • Lavorare su un esempio Random Forest Esercizio di classificazione

Utilizzo di K-means Clustering

  • Comprendere la teoria del clustering K-means
  • Implementazione di un codice di clustering K-means
  • Utilizzo di un esercizio di clustering di esempio

Utilizzo dei sistemi di raccomandazione

Implementazione dell'elaborazione del linguaggio naturale

  • Comprensione Natural Language Processing (NLP)
  • Panoramica degli strumenti di PNL
  • Lavorare su un esempio di esercizio di PNL

Streaming con Spark attivo Python

  • Panoramica Streaming con Spark
  • Esempio Spark Streaming Esercizio

Osservazioni conclusive

Requisiti

  • Competenze generali di programmazione

Pubblico

  • Gli sviluppatori
  • Professionisti IT
  • Scienziati dei dati
  21 ore
 

Numero di Partecipanti


Data Inizio

Data Fine


Le date sono soggette a disponibilità e si svolgono tra le 09:30 e le 16:30.
I corsi di formazione pubblici richiedono più di 5 partecipanti.

Recensioni (5)

Corsi relativi

Categorie relative