Struttura del corso
- Nozioni di base sui big data
- I Big Data e il loro ruolo nel mondo aziendale
- Le fasi di sviluppo di una strategia Big Data all'interno di un'azienda
- Spiegare la logica alla base di un approccio olistico ai Big Data
- Componenti necessari in una piattaforma Big Data
- Soluzione per l'archiviazione di Big Data
- Limiti delle tecnologie tradizionali
- Cenni preliminari sui tipi di database
- Le quattro dimensioni dei Big Data
- L'impatto dei big data sul business
- L'importanza dei Big Data per il business
- Sfide nell'estrazione di dati utili
- Integrazione dei Big Data con i dati tradizionali
- Tecnologie di archiviazione dei big data
- Panoramica delle tecnologie dei big data
- Modelli di archiviazione dei dati
- Hadoop
- Alveare
- Cassandra
- MongoDB (MongoDB)
- Scegliere la giusta tecnologia per i big data
- Elaborazione dei big data
- Connessione ed estrazione di dati dal database
- Trasformazione e preparazione dei dati per l'elaborazione
- Utilizzo di Hadoop MapReduce per l'elaborazione di dati distribuiti
- Monitoraggio ed esecuzione dei processi Hadoop MapReduce
- Blocchi predefiniti del file system distribuito Hadoop
- Mapreduce e Yarn
- Gestione dei dati in streaming con Spark
- Strumenti e tecnologie per l'analisi dei big data
- Programmazione di Hadoop con il linguaggio latino Pig
- Esecuzione di query sui Big Data con Hive
- Estrazione di dati con Mahout
- Strumenti di visualizzazione e reportistica
- I big data nel mondo degli affari
- Gestire e stabilire le esigenze dei Big Data
- L'importanza dei Big Data per il business
- Selezione degli strumenti di big data giusti per il problema
Concetti relativi al data warehousing
- Che cos'è Data Ware House?
- Differenza tra OLTP e Data Ware Housing
- Acquisizione dati
- Estrazione dei dati
- Trasformazione dei dati.
- Caricamento dei dati
- Mart di dati
- Data Mart dipendente vs indipendente
- Progettazione di basi di dati
Concetti di test ETL:
- Introduzione.
- Ciclo di vita dello sviluppo software.
- Metodologie di test.
- Processo del flusso di lavoro di test ETL.
- Responsabilità dei test ETL nella fase Dati.
Nozioni di base sui big data
- Big Data e il suo ruolo nel mondo aziendale
- Le fasi di sviluppo di una Big Data strategia all'interno di un'azienda
- Spiegare la logica alla base di un approccio olistico a Big Data
- Componenti necessari in una Big Data Piattaforma
- Soluzione per l'archiviazione di Big Data
- Limiti delle tecnologie tradizionali
- Cenni preliminari sui tipi di database
NoSQL Banche dati
Hadoop
Riduci mappa
Apache Spark
Requisiti
I delegati devono avere una certa consapevolezza e una certa esperienza degli strumenti di archiviazione e una certa dimestichezza con la gestione di grandi set di dati
Recensioni (4)
La formazione è stata condotta in modo interessante e professionale, il che ha permesso di sistematizzare e ampliare la conoscenza dell'argomento formativo. Il presentatore ha dimostrato molta esperienza e capacità di trasmettere informazioni. La formazione è stata molto pratica e su misura per le nostre esigenze. Consigliato
Dominik Kozłowski - Shell Polska
Corso - Big Data - Data Science
Traduzione automatica
L'inizio del giorno 3 è stato il migliore.
- Shell Polska
Corso - Big Data - Data Science
Traduzione automatica
Chi creerà il miglior esercizio modello
Wojtek - Shell Polska
Corso - Big Data - Data Science
Traduzione automatica
trainer's knowledge