Struttura del corso

Introduzione a Data Analysis e Big Data

    Cosa rende Big Data "grande"? Velocità, Volume, Varietà, Veridicità (VVVV)
Limiti al trattamento tradizionale dei dati
  • Elaborazione distribuita
  • Analisi statistica
  • Tipi di analisi Machine Learning
  • Data Visualization
  • Big Data Ruoli e responsabilità
  • Gli amministratori Gli sviluppatori Analisti di dati

      Languages Utilizzato per l'analisi dei dati

    R Language Perché R per l'analisi dei dati? Manipolazione dei dati, calcolo e visualizzazione grafica

      Python Perché Python per l'analisi dei dati?
    Manipolazione, elaborazione, pulizia e elaborazione dei dati
  • Approcci a Data Analysis
  • Analisi statistica Analisi delle serie temporali Previsione con modelli di correlazione e regressione Inferenziale Statistics (stima) Descrittivo Statistics negli insiemi di Big Data (ad es. calcolo della media)
  • Machine Learning Apprendimento supervisionato vs apprendimento non supervisionato

      Classificazione e clustering
    Stima del costo di metodi specifici
  • Filtraggio
  • Elaborazione del linguaggio naturale Elaborazione del testo
  • Comprensione del significato del testo
  • Generazione automatica del testo
  • Analisi del sentiment / analisi dell'argomento
  • Computer Vision Acquisizione, elaborazione, analisi e comprensione delle immagini
  • Ricostruire, interpretare e comprendere scene 3D
  • Utilizzo dei dati delle immagini per prendere decisioni
  • Big Data Infrastruttura
  • Archiviazione dei dati Basi di dati relazionali (SQL) Il mioSQL Postgres Oracolo
  • Basi di dati non relazionali (NoSQL) Cassandra
  • MongoDB
  • Neo4js
  • Comprendere le sfumature Database gerarchici

      Basi di dati orientate agli oggetti
    Basi di dati orientate ai documenti
  • Basi di dati orientate ai grafi
  • Altro__________
  • Elaborazione distribuita Hadoop HDFS come file system distribuito
  • MapReduce per l'elaborazione distribuita
  • Scintilla Framework di cluster computing in-memory all-in-one per l'elaborazione di dati su larga scala
  • Streaming strutturato
  • Scintilla SQL
  • Machine Learning librerie: MLlib
  • Elaborazione grafica con GraphX
  • ScalaAbilità Cloud pubblico AWS, Google, Aliyun, ecc. Cloud privato OpenStack, Cloud Foundry, ecc.
  • Scalabilità automatica
  • Scegliere la soluzione giusta per il problema
  • Il futuro di Big Data
  • Riassunto e conclusione
  • Requisiti

    • Una comprensione generale della matematica.
    • Una conoscenza generale della programmazione.
    • Conoscenza generale dei database.

    Pubblico

    • Sviluppatori / programmatori
    • Consulenti IT
     35 ore

    Numero di Partecipanti



    Prezzo per Partecipante

    Recensioni (2)

    Corsi relativi

    Categorie relative