Struttura del corso
Introduzione alla piattaforma Stratio
- Panoramica dell'architettura di Stratio e dei moduli principali
- Ruolo di Rocket e Intelligence nel ciclo di vita dei dati
- Accesso ed esplorazione dell'interfaccia utente di Stratio
Lavorare con il modulo Rocket
- Ingestione dei dati e creazione della pipeline
- Connessione alle fonti dati e configurazione delle trasformazioni
- Utilizzo di PySpark per task di preprocessing in Rocket
Nozioni di base su PySpark per gli utenti di Stratio
- Strutture dati e operazioni di PySpark
- Costrutti ciclici: utilizzo di for, while, if/else
- Scrittura di funzioni personalizzate con def ed applicazione
Utilizzo avanzato di Rocket con PySpark
- Ingestione e trasformazioni in streaming
- Utilizzo dei loop e delle funzioni nelle scenari batch ed in tempo reale
- Best practice per la performance nei pipeline di PySpark
Esplorazione del modulo Intelligence
- Panoramica delle funzionalità di modellazione e analisi dei dati
- Selezione, trasformazione ed esplorazione delle caratteristiche
- Ruolo di PySpark nell'analisi personalizzata e nelle insights
Creazione di workflow avanzati di analisi
- Creazione di funzioni definite dall'utente (UDFs) in Intelligence
- Applicazione di condizionali e loop per la logica dei dati
- Casistiche: segmentazione, aggregazione e predizione
Deployment e Collaboration
- Salvataggio, esportazione ed riutilizzo dei workflow
- Collaborazione con altri membri del team su Stratio
- Revisione dell'output e integrazione con strumenti downstream
Riepilogo ed ulteriori passaggi
Requisiti
- Esperienza con la programmazione Python
- Comprensione dei concetti di analisi dei dati o elaborazione big data
- Conoscenze di base di Apache Spark e calcolo distribuito
Pubblico di riferimento
- Engineer dei dati che lavorano su piattaforme basate su Stratio
- Analisti o sviluppatori che utilizzano i moduli Rocket e Intelligence
- Team tecnici in transizione ai workflow PySpark all'interno di Stratio
Recensioni (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Corso - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Corso - QGIS for Geographic Information System
Mi è piaciuto lo stile di Pablo, il fatto che abbia trattato molti argomenti, dalla progettazione di report, alla personalizzazione con html all'implementazione di semplici algoritmi ML. Good equilibrio informazioni teoriche / esercizi. Pablo ha davvero coperto tutti gli argomenti che mi interessavano e ha dato risposte esaurienti alle mie domande.
Cristian Tudose - SC Automobile Dacia SA
Corso - Advanced Data Analysis with TIBCO Spotfire
Traduzione automatica
Actual application of spotfire and all basic functions.
Michael Capili - STMicroelectronics, Inc.
Corso - Introduction to Spotfire
The thing I liked the most about the training was the organization and the location