Struttura del corso

Breve descrizione

  • Fonti di dati
  • Attenzione ai dati
  • Sistemi di raccomandazione
  • Obiettivo Marketing

Tipi

  • Strutturato vs non strutturato
  • Statico vs in streaming
  • Dati attitudinali, comportamentali e demografici
  • Analisi basata sui dati e analisi basata sull'utente
  • Validità dei dati
  • Volume, velocità e varietà di dati

Modelli

  • Modelli di costruzione
  • Modelli statistici
  • Apprendimento automatico

Classificazione dei dati

  • Clustering
  • kGruppi, k-mezzi, i vicini più prossimi
  • Colonie di formiche, uccelli che si affollano

Modelli predittivi

  • Alberi decisionali
  • Macchina vettoriale di supporto
  • Classificazione di Naive Bayes
  • Reti neurali
  • Modello di Markov
  • Regressione
  • Metodi di ensemble

RE

  • Rapporto costi/benefici
  • Costo del software
  • Costo di sviluppo
  • Potenziali vantaggi

Modelli di costruzione

  • Preparazione dei dati (MapReduce)
  • Pulizia dei dati
  • Scelta dei metodi
  • Modello in via di sviluppo
  • Modello di test
  • Valutazione del modello
  • Distribuzione e integrazione dei modelli

Panoramica del software Open Source e commerciale

  • Selezione del pacchetto R-project
  • Python Biblioteche
  • Hadoop e Mahout
  • Progetti Apache selezionati relativi a Big Data e Analytics
  • Soluzione commerciale selezionata
  • Integrazione con software e fonti di dati esistenti

Requisiti

Comprensione dei metodi tradizionali di gestione e analisi dei dati come SQL, data warehouse, business intelligence, OLAP, ecc... Comprensione della statistica di base e della probabilità (media, varianza, probabilità, probabilità condizionata, ecc...)

 21 ore

Numero di Partecipanti



Prezzo per Partecipante

Recensioni (2)

Corsi relativi

Unified Batch and Stream Processing with Apache Beam

14 ore

Categorie relative