Struttura del corso

Breve descrizione

  • Fonti di dati
  • Attenzione ai dati
  • Sistemi di raccomandazione
  • Obiettivo Marketing

Tipi

  • Strutturato vs non strutturato
  • Statico vs in streaming
  • Dati attitudinali, comportamentali e demografici
  • Analisi basata sui dati e analisi basata sull'utente
  • Validità dei dati
  • Volume, velocità e varietà di dati

Modelli

  • Modelli di costruzione
  • Modelli statistici
  • Apprendimento automatico

Classificazione dei dati

  • Clustering
  • kGruppi, k-mezzi, i vicini più prossimi
  • Colonie di formiche, uccelli che si affollano

Modelli predittivi

  • Alberi decisionali
  • Macchina vettoriale di supporto
  • Classificazione di Naive Bayes
  • Reti neurali
  • Modello di Markov
  • Regressione
  • Metodi di ensemble

RE

  • Rapporto costi/benefici
  • Costo del software
  • Costo di sviluppo
  • Potenziali vantaggi

Modelli di costruzione

  • Preparazione dei dati (MapReduce)
  • Pulizia dei dati
  • Scelta dei metodi
  • Modello in via di sviluppo
  • Modello di test
  • Valutazione del modello
  • Distribuzione e integrazione dei modelli

Panoramica del software Open Source e commerciale

  • Selezione del pacchetto R-project
  • Python Biblioteche
  • Hadoop e Mahout
  • Progetti Apache selezionati relativi a Big Data e Analytics
  • Soluzione commerciale selezionata
  • Integrazione con software e fonti di dati esistenti

Requisiti

Comprensione dei metodi tradizionali di gestione e analisi dei dati come SQL, data warehouse, business intelligence, OLAP, ecc... Comprensione della statistica di base e della probabilità (media, varianza, probabilità, probabilità condizionata, ecc...)

  21 ore
 

Numero di Partecipanti


Data Inizio

Data Fine


Le date sono soggette a disponibilità e si svolgono tra le 09:30 e le 16:30.
I corsi di formazione pubblici richiedono più di 5 partecipanti.

Recensioni (2)

Corsi relativi

Unified Batch and Stream Processing with Apache Beam

  14 ore

Categorie relative