Struttura del corso
Introduzione alla Piattaforma Stratio
- Panoramica dell'architettura di Stratio e dei moduli principali
- Ruolo di Rocket e Intelligence nel ciclo di vita dei dati
- Accesso e navigazione nell'interfaccia utente di Stratio
Lavorare con il Modulo Rocket
- Ingestione dei dati e creazione delle pipeline
- Connettività con fonti di dati e configurazione delle trasformazioni
- Utilizzo di PySpark per compiti di preprocessing in Rocket
Elementi Fondamentali di PySpark per gli Utenti Stratio
- Strutture dati e operazioni di PySpark
- Costrutti di ciclo: for, while, if/else
- Scrittura di funzioni personalizzate con def e applicazione delle stesse
Utilizzo Avanzato di Rocket con PySpark
- Ingestione streaming e trasformazioni
- Utilizzo di cicli e funzioni in scenari batch e real-time
- Best practices per la performance nelle pipeline PySpark
Esplorazione del Modulo Intelligence
- Panoramica delle funzionalità di modellazione e analisi dei dati
- Selezione, trasformazione ed esplorazione delle feature
- Ruolo di PySpark in analisi personalizzate e insights
Creazione di Workflow di Analytics Avanzati
- Creazione di funzioni definite dall'utente (UDFs) in Intelligence
- Applicazione di condizionali e cicli per la logica dei dati
- Casistiche: segmentazione, aggregazione e previsione
Distribuzione e Collaborazione
- Salvataggio, esportazione e riutilizzo dei workflow
- Collaborazione con altri membri del team su Stratio
- Revisione dell'output e integrazione con strumenti downstream
Riepilogo e Passi Successivi
Requisiti
- Esperienza di programmazione con Python
- Comprensione dei concetti di analisi dei dati o processing del big data
- Conoscenze basilari di Apache Spark e calcolo distribuito
Pubblico Target
- Ingegneri dei dati che lavorano su piattaforme basate su Stratio
- Analisti o sviluppatori che utilizzano i moduli Rocket e Intelligence
- Squadre tecniche in transizione verso flussi di lavoro PySpark all'interno di Stratio
Recensioni (4)
The thing I liked the most about the training was the organization and the location
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Corso - ArcGIS for Spatial Analysis
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Corso - ArcGIS Fundamentals
I really enjoyed the training. I found all modules to be applicable to problems that I am trying to solve at work. The integration of the training with jupyter notebooks was really impressive.
Mark Firmin - Environment and Climate Change Canada
Corso - Python for Geographic Information System (GIS)
All the topics which he covered including examples. And also explained how they are helpful in our daily job.