Struttura del corso
Introduzione
Installazione e configurazione di Dataiku Data Science Studio (DSS)
- Requisiti di sistema per Dataiku DSS
- Configurazione delle integrazioni di Apache Hadoop e Apache Spark
- Configurazione di Dataiku DSS con proxy Web
- Migrazione da altre piattaforme a Dataiku DSS
Panoramica delle funzionalità e dell'architettura di Dataiku DSS
- Oggetti e grafi di base fondamentali per Dataiku DSS
- Che cos'è una ricetta in Dataiku DSS?
- Tipi di set di dati supportati da Dataiku DSS
Creazione di un progetto Dataiku DSS
Definizione di set di dati per la connessione alle risorse di dati in Dataiku DSS
- Utilizzo dei connettori DSS e dei formati di file
- Formati DSS standard e formati specifici per Hadoop
- Caricamento di file per un progetto Dataiku DSS
Panoramica del file system del server in Dataiku DSS
Creazione e utilizzo di cartelle gestite
- Ricetta Dataiku DSS per unire la cartella
- Cartelle gestite locali e non locali
Costruzione di un set di dati del file system utilizzando il contenuto delle cartelle gestite
- Esecuzione di pulizie con una ricetta di codice DSS
Utilizzo del set di dati delle metriche e del set di dati delle statistiche interne
Implementazione della ricetta di download DSS per il set di dati HTTP
Rilocazione SQL di set di dati e set di dati HDFS tramite DSS
Ordinamento dei set di dati in Dataiku DSS
- Ordinamento del writer e ordinamento in fase di lettura
Esplorazione e preparazione di oggetti visivi dati per un progetto Dataiku DSS
Panoramica degli schemi, dei tipi di archiviazione e dei significati di Dataiku
Esecuzione di script di pulizia, normalizzazione e arricchimento dei dati in Dataiku DSS
Utilizzo dell'interfaccia dei grafici Dataiku DSS e dei tipi di aggregazioni visive
Utilizzo della funzione interattiva Statistics di DSS
- Analisi univariata vs. analisi bivariata
- Utilizzo dello strumento DSS per l'analisi delle componenti principali (PCA)
Panoramica di Machine Learning con Dataiku DSS
- Confronto tra ML supervisionato e ML non supervisionato
- Riferimenti per la gestione degli algoritmi e delle funzionalità di DSS ML
- Deep Learning con Dataiku DSS
Panoramica del flusso derivato da set di dati e ricette DSS
Trasformazione di set di dati esistenti in DSS con ricette visive
Utilizzo di ricette DSS basate su codice definito dall'utente
Ottimizzazione dell'esplorazione e della sperimentazione del codice con i notebook di codice DSS
Scrittura di visualizzazioni DSS avanzate e funzionalità frontend personalizzate con le app Web
Utilizzo della funzione Dataiku DSS Code Reports
Condivisione dei progetti di dati Element e familiarizzazione con il dashboard DSS
Progettazione e creazione di pacchetti di un progetto Dataiku DSS come applicazione riutilizzabile
Panoramica dei metodi avanzati in Dataiku DSS
- Implementazione del partizionamento ottimizzato dei set di dati tramite DSS
- Esecuzione di parti specifiche di elaborazione DSS tramite calcoli in Kubernetes contenitori
Panoramica di Collaboration e controllo della versione in Dataiku DSS
Implementazione di scenari, metriche e controlli di automazione per il test dei progetti DSS
Distribuzione e aggiornamento di un progetto con il nodo e i bundle di automazione DSS
Utilizzo delle API in tempo reale in Dataiku DSS
- API aggiuntive e API REST in DSS
Analisi e Forecasting Dataiku DSS Time Series
Protezione di un progetto in Dataiku DSS
- Gestione delle autorizzazioni di progetto e delle autorizzazioni del dashboard
- Implementazione di opzioni di sicurezza avanzate
Integrazione di Dataiku DSS con il cloud
Risoluzione dei problemi
Riassunto e conclusione
Requisiti
- Esperienza con i linguaggi di programmazione Python, SQL e R
- Conoscenza di base dell'elaborazione dei dati con Apache Hadoop e Spark
- Comprensione dei concetti di machine learning e dei modelli di dati
- Background in analisi statistica e concetti di data science
- Esperienza nella visualizzazione e nella comunicazione dei dati
Pubblico
- ingegneri
- Scienziati dei dati
- Analisti di dati