Struttura del corso

Introduzione agli Ecosistemi Big Data

  • Panoramica delle tecnologie e architetture big data
  • Elaborazione a batch vs elaborazione in tempo reale
  • Strategie di archiviazione dei dati per la scalabilità

Elaborazione Avanzata con Apache Spark

  • Ottimizzazione delle mansioni Spark per le prestazioni
  • Trasformazioni e azioni avanzate
  • Lavoro con lo streaming strutturato

Machine Learning su scala grande

  • Tecniche di addestramento modelli distribuiti
  • Attrezzatura per la regolazione dei parametri iper e grandi set di dati
  • Deploy del modello in ambienti big data

Deep Learning per Big Data

  • Integrazione di TensorFlow e PyTorch con Spark
  • Pipeline di addestramento di deep learning distribuite
  • Casi d'uso nell'analisi delle immagini, del testo e delle serie temporali

Analitica in Tempo Reale e Streaming dei Dati

  • Apache Kafka per l'ingestione di dati di flusso
  • Framework di elaborazione dei flussi
  • Monitoraggio e avviso in sistemi in tempo reale

Sicurezza Data Governance ed Etica

  • Richieste di privacy dei dati e conformità
  • Gestione del controllo e crittografia nei sistemi big data Access
  • Considerazioni etiche nell'analitica a grande scala

Integrazione tra Big Data e Business Intelligence

  • Visualizzazione dei dati e creazione di dashboard per grandi quantità di dati
  • Connessione delle pipeline big data agli strumenti di BI
  • Motivazione degli esiti aziendali con l'analitica avanzata

Riepilogo e Passaggi Successivi

Requisiti

  • Comprensione solida di concetti di analisi dei dati e modellazione statistica
  • Esperienza con strumenti di elaborazione dei dati e linguaggi di programmazione come Python, R o Scala
  • Familiarità con framework di calcolo distribuito come Hadoop o Spark

Pubblico

  • Scienziati dei dati che aspirano a dominare il processing dei grandi volumi di dati e l'analisi predittiva
  • Analisti senior in cerca di progettare ed implementare flussi di lavoro analitici avanzati
  • Professionali R&D concentrati su soluzioni innovative basate sui dati
 42 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (5)

Corsi in Arrivo

Categorie relative