Struttura del corso

  1. Nozioni di base sui big data
  2. I Big Data e il loro ruolo nel mondo aziendale
  3. Le fasi di sviluppo di una strategia Big Data all'interno di un'azienda
  4. Spiegare la logica alla base di un approccio olistico ai Big Data
  5. Componenti necessari in una piattaforma Big Data
  6. Soluzione per l'archiviazione di Big Data
  7. Limiti delle tecnologie tradizionali
  8. Cenni preliminari sui tipi di database
  9. Le quattro dimensioni dei Big Data
  10. L'impatto dei big data sul business
  11. L'importanza dei Big Data per il business
  12. Sfide nell'estrazione di dati utili
  13. Integrazione dei Big Data con i dati tradizionali
  14. Tecnologie di archiviazione dei big data
  15. Panoramica delle tecnologie dei big data
  16. Modelli di archiviazione dei dati
  17. Hadoop
  18. Alveare
  19. Cassandra
  20. MongoDB (MongoDB)
  21. Scegliere la giusta tecnologia per i big data
  22. Elaborazione dei big data
  23. Connessione ed estrazione di dati dal database
  24. Trasformazione e preparazione dei dati per l'elaborazione
  25. Utilizzo di Hadoop MapReduce per l'elaborazione di dati distribuiti
  26. Monitoraggio ed esecuzione dei processi Hadoop MapReduce
  27. Blocchi predefiniti del file system distribuito Hadoop
  28. Mapreduce e Yarn
  29. Gestione dei dati in streaming con Spark
  30. Strumenti e tecnologie per l'analisi dei big data
  31. Programmazione di Hadoop con il linguaggio latino Pig
  32. Esecuzione di query sui Big Data con Hive
  33. Estrazione di dati con Mahout
  34. Strumenti di visualizzazione e reportistica
  35. I big data nel mondo degli affari
  36. Gestire e stabilire le esigenze dei Big Data
  37. L'importanza dei Big Data per il business
  38. Selezione degli strumenti di big data giusti per il problema

 

Concetti relativi al data warehousing

  • Che cos'è Data Ware House?
  • Differenza tra OLTP e Data Ware Housing
  • Acquisizione dati
  • Estrazione dei dati
  • Trasformazione dei dati.
  • Caricamento dei dati
  • Mart di dati
  • Data Mart dipendente vs indipendente
  • Progettazione di basi di dati

Concetti di test ETL:

  • Introduzione.
  • Ciclo di vita dello sviluppo software.
  • Metodologie di test.
  • Processo del flusso di lavoro di test ETL.
  • Responsabilità dei test ETL nella fase Dati.

Nozioni di base sui big data

  • Big Data e il suo ruolo nel mondo aziendale
  • Le fasi di sviluppo di una Big Data strategia all'interno di un'azienda
  • Spiegare la logica alla base di un approccio olistico a Big Data
  • Componenti necessari in una Big Data Piattaforma
  • Soluzione per l'archiviazione di Big Data
  • Limiti delle tecnologie tradizionali
  • Cenni preliminari sui tipi di database

NoSQL Banche dati

Hadoop

Riduci mappa

Apache Spark

 

Requisiti

I delegati devono avere una certa consapevolezza e una certa esperienza degli strumenti di archiviazione e una certa dimestichezza con la gestione di grandi set di dati

 14 ore

Numero di Partecipanti



Prezzo per Partecipante

Recensioni (4)

Corsi relativi

Unified Batch and Stream Processing with Apache Beam

14 ore

Categorie relative