Struttura del corso

Introduzione

    Il processo Data Science Ruoli e responsabilità di un Data Scientist

Preparazione dell'ambiente di sviluppo

    Librerie, framework, linguaggi e strumenti Sviluppo locale Sviluppo collaborativo basato sul Web

Raccolta dei dati

    Diversi tipi di dati Strutturato  Database locali Connettori di database Formati comuni: xlxs, XML, Json, csv, ...
Non strutturato Non sono un 10 anni fa-anno-fa-2015-20
  • Api
  • Internet of Things (IoT)
  • Documenti, immagini, video, suoni
  • Caso di studio: Raccolta continua di grandi quantità di dati non strutturati
  • Archiviazione dei dati Database relazionali Database non relazionali Hadoop: File system distribuito (HDFS) Spark: set di dati distribuito resiliente (RDD) Archiviazione cloud
  • Preparazione dei dati
  • Ingestione, selezione, pulizia e trasformazione Garantire la qualità dei dati: correttezza, significatività e sicurezza Rapporti sulle eccezioni

      Languages utilizzato per la preparazione, l'elaborazione e l'analisi

    Linguaggio R Introduzione a R Manipolazione dei dati, calcolo e visualizzazione grafica

      Python Introduzione a Python

    Manipolazione, elaborazione, pulizia e elaborazione dei dati

      Analisi dei dati
    Analisi esplorativa Statistiche di base Visualizzazioni bozza Comprendere i dati 
  • Causalità
  • Caratteristiche e trasformazioni
  • Machine Learning Supervisionato vs non sorpevivisto

      Quando usare quale modello
    Natural Language Processing (NLP)
  • Data Visualization
  • Procedure consigliate Selezione del grafico giusto per i dati giusti Tavolozze di colori Portarlo al livello successivo Dashboard Visualizzazioni interattive
  • Storytelling con i dati
  • Riassunto e conclusione
  • Requisiti

    • Una comprensione generale dei concetti relativi ai database
    • Una conoscenza di base della statistica
     35 ore

    Numero di Partecipanti



    Prezzo per Partecipante

    Recensioni (1)

    Categorie relative