Struttura del corso

Introduzione all'Analisi dei Dati e ai Big Data

  • Cosa rende i Big Data "Grandi"?
    • Velocità, Volume, Varietà, Veridicità (VVVV)
  • Limiti del Processing Tradizionale dei Dati
  • Processing Distribuito
  • Analisi Statistica
  • Tipi di Analisi di Machine Learning
  • Data Visualization

Ruoli e Responsabilità nei Big Data

  • Amministratori
  • Sviluppatori
  • Analisti dei Dati

Linguaggi Utilizzati per l'Analisi dei Dati

  • Linguaggio R
    • Perché R per l'analisi dei dati?
    • Manipolazione dei dati, calcolo e visualizzazione grafica
  • Python
    • Perché Python per l'analisi dei dati?
    • Manipolazione, processing, pulizia e analisi dei dati

Approcci all'Analisi dei Dati

  • Analisi Statistica
    • Analisi di Serie Temporali
    • Previsione con modelli di Correlazione e Regressione
    • Statistica Inferenziale (stima)
    • Statistica Descrittiva nei Set di Dati Big Data (ad esempio, calcolo della media)
  • Machine Learning
    • Apprendimento supervisionato vs non supervisionato
    • Classificazione e clustering
    • Stima del costo di metodi specifici
    • Filtraggio
  • Elaborazione del Linguaggio Naturale
    • Processing del testo
    • Comprensione del significato del testo
    • Generazione automatica di testo
    • Analisi dell'umore / analisi tematica
  • Visione Artificiale
    • Acquisizione, processing, analisi e comprensione delle immagini
    • Ricostruzione, interpretazione e comprensione di scene 3D
    • Utilizzo dei dati delle immagini per prendere decisioni

Infrastruttura Big Data

  • Storage dei Dati
    • Database relazionali (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Database non relazionali (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4j
    • Comprendere le sfumature
      • Database gerarchici
      • Database orientati agli oggetti
      • Database orientati ai documenti
      • Database orientati ai grafi
      • Altri
  • Processing Distribuito
    • Hadoop
      • HDFS come filesystem distribuito
      • MapReduce per il processing distribuito
    • Spark
      • Framework di computing cluster in memoria tutto-in-uno per l'elaborazione su larga scala dei dati
      • Streaming strutturato
      • Spark SQL
      • Biblioteche di Machine Learning: MLlib
      • Elaborazione grafi con GraphX
  • Scalabilità
    • Nuvola pubblica
      • AWS, Google, Aliyun, ecc.
    • Nuvola privata
      • OpenStack, Cloud Foundry, ecc.
    • Auto-scalabilità

Scegliere la Soluzione Giusta per il Problema

Il Futuro dei Big Data

Riassunto e Prossimi Passi

Requisiti

  • Comprensione generale della matematica
  • Comprensione generale della programmazione
  • Comprensione generale dei database

Pubblico di Riferimento

  • Sviluppatori / programmatori
  • Consulenti IT
 35 Ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (7)

Corsi in Arrivo

Categorie relative