Struttura del corso
Introduzione all'Analisi dei Dati e ai Big Data
- Cosa rende i Big Data "Grandi"?
- Velocità, Volume, Varietà, Veridicità (VVVV)
- Limiti del Processing Tradizionale dei Dati
- Processing Distribuito
- Analisi Statistica
- Tipi di Analisi di Machine Learning
- Data Visualization
Ruoli e Responsabilità nei Big Data
- Amministratori
- Sviluppatori
- Analisti dei Dati
Linguaggi Utilizzati per l'Analisi dei Dati
- Linguaggio R
- Perché R per l'analisi dei dati?
- Manipolazione dei dati, calcolo e visualizzazione grafica
- Python
- Perché Python per l'analisi dei dati?
- Manipolazione, processing, pulizia e analisi dei dati
Approcci all'Analisi dei Dati
- Analisi Statistica
- Analisi di Serie Temporali
- Previsione con modelli di Correlazione e Regressione
- Statistica Inferenziale (stima)
- Statistica Descrittiva nei Set di Dati Big Data (ad esempio, calcolo della media)
- Machine Learning
- Apprendimento supervisionato vs non supervisionato
- Classificazione e clustering
- Stima del costo di metodi specifici
- Filtraggio
- Elaborazione del Linguaggio Naturale
- Processing del testo
- Comprensione del significato del testo
- Generazione automatica di testo
- Analisi dell'umore / analisi tematica
- Visione Artificiale
- Acquisizione, processing, analisi e comprensione delle immagini
- Ricostruzione, interpretazione e comprensione di scene 3D
- Utilizzo dei dati delle immagini per prendere decisioni
Infrastruttura Big Data
- Storage dei Dati
- Database relazionali (SQL)
- MySQL
- Postgres
- Oracle
- Database non relazionali (NoSQL)
- Cassandra
- MongoDB
- Neo4j
- Comprendere le sfumature
- Database gerarchici
- Database orientati agli oggetti
- Database orientati ai documenti
- Database orientati ai grafi
- Altri
- Database relazionali (SQL)
- Processing Distribuito
- Hadoop
- HDFS come filesystem distribuito
- MapReduce per il processing distribuito
- Spark
- Framework di computing cluster in memoria tutto-in-uno per l'elaborazione su larga scala dei dati
- Streaming strutturato
- Spark SQL
- Biblioteche di Machine Learning: MLlib
- Elaborazione grafi con GraphX
- Hadoop
- Scalabilità
- Nuvola pubblica
- AWS, Google, Aliyun, ecc.
- Nuvola privata
- OpenStack, Cloud Foundry, ecc.
- Auto-scalabilità
- Nuvola pubblica
Scegliere la Soluzione Giusta per il Problema
Il Futuro dei Big Data
Riassunto e Prossimi Passi
Requisiti
- Comprensione generale della matematica
- Comprensione generale della programmazione
- Comprensione generale dei database
Pubblico di Riferimento
- Sviluppatori / programmatori
- Consulenti IT
Recensioni (7)
Come funzionano i big data, i programmi di dati, una maggiore conoscenza di come funziona il nostro mondo attuale utilizzando i dati
Ozayr Hussain - Vodacom
Corso - A Practical Introduction to Data Analysis and Big Data
Traduzione automatica
Il lato pratico della formazione.
Patrick - Vodacom PTy Ltd
Corso - A Practical Introduction to Data Analysis and Big Data
Traduzione automatica
Interactive topics and the style used by the lecture to simplified the topics for the students
Miran Saeed - Sulaymaniyah Asayish Agency
Corso - A Practical Introduction to Data Analysis and Big Data
the trainer and his ability to lecture
ibrahim hamakarim - Sulaymaniyah Asayish Agency
Corso - A Practical Introduction to Data Analysis and Big Data
Practical exercises
JOEL CHIGADA - University of the Western Cape
Corso - A Practical Introduction to Data Analysis and Big Data
R programming
Osden Jokonya - University of the Western Cape
Corso - A Practical Introduction to Data Analysis and Big Data
Overall the Content was good.