Struttura del corso
Introduzione
Installazione e Configurazione di Dataiku Data Science Studio (DSS)
- Requisiti di sistema per Dataiku DSS
- Configurazione delle integrazioni con Apache Hadoop e Apache Spark
- Configurazione di Dataiku DSS con web proxy
- Migrazione da altre piattaforme a Dataiku DSS
Panoramica delle Funzionalità e dell'Architettura di Dataiku DSS
- Oggetti principali e grafi fondamentali per Dataiku DSS
- Cosa è una ricetta in Dataiku DSS?
- Tipi di dataset supportati da Dataiku DSS
Creazione di un Progetto Dataiku DSS
Definizione di Dataset per Connessione a Risorse di Dati in Dataiku DSS
- Lavorare con i connettori DSS e i formati file
- Formati standard DSS vs. formati specifici per Hadoop
- Caricare File per un Progetto Dataiku DSS
Panoramica del Filesystem Server in Dataiku DSS
Creazione e Utilizzo di Cartelle Gestite
- Ricetta Dataiku DSS per la cartella di fusione
- Cartelle gestite locali vs. non-locali
Costruzione di un Dataset Filesystem Utilizzando i Contenuti delle Cartelle Gestite
- Eseguire pulizie con una ricetta codice DSS
Lavorare con il Dataset di Metriche e il Dataset Interno di Statistiche
Implementazione della Ricetta Download DSS per un Dataset HTTP
Riposizionamento dei Dataset SQL e HDFS Utilizzando DSS
Ordinamento di Dataset in Dataiku DSS
- ordinamento dello scrittore vs. ordinamento durante la lettura
Esplorazione e Preparazione di Visualizzazioni dei Dati per un Progetto Dataiku DSS
Panoramica degli Schemi, Tipi di Archiviazione e Significati in Dataiku
Esecuzione di Script di Pulizia, Normalizzazione ed Arricchimento dei Dati in Dataiku DSS
Lavorare con l'Interfaccia Grafica delle Chart e i Tipi di Aggregazioni Visive in Dataiku DSS
Utilizzo della Funzione di Statistiche Interattive di DSS
- Analisi univariata vs. analisi bivariata
- Utilizzare l'analisi delle componenti principali (PCA) dello strumento DSS
Panoramica del Machine Learning con Dataiku DSS
- ML supervisionato vs. non supervisionato
- Riferimenti per gli algoritmi ML di DSS e la gestione delle caratteristiche
- Deep Learning con Dataiku DSS
Panoramica del Flusso Derivato dai Dataset e Ricette di DSS
Trasformazione di Dataset Esistenti in DSS con Ricette Visive
Utilizzo di Ricette DSS Basate su Codice Definito dall'Utente
Ottimizzazione dell'Esplorazione e Sperimentazione del Codice con i Notebook di Codice DSS
Scrittura di Visualizzazioni Avanzate e Funzionalità Personalizzate del Frontend con Webapps in DSS
Lavorare con la Funzione Report di Codice Dataiku DSS
Condivisione degli Elementi del Progetto Dati e Familiarizzazione con il Dashboard DSS
Progettazione e Imballo di un Progetto Dataiku DSS come Applicazione Riutilizzabile
Panoramica dei Metodi Avanzati in Dataiku DSS
- Implementazione della partizionamento ottimizzato di dataset utilizzando DSS
- Esecuzione di parti specifiche del processing DSS attraverso calcoli nei contenitori Kubernetes
Panoramica della Collaborazione e del Controllo delle Versioni in Dataiku DSS
Implementazione di Scenari di Automazione, Metriche e Controlli per il Test del Progetto DSS
Distribuzione e Aggiornamento di un Progetto con l'Automazione Node e i Bundle di DSS
Lavorare con API in Tempo Reale in Dataiku DSS
- API aggiuntive e REST API in DSS
Analisi e Previsione di Serie Temporali in Dataiku DSS
Sicurezza del Progetto in Dataiku DSS
- Gestione delle autorizzazioni del progetto e dei dashboard
- Implementazione di Opzioni di Sicurezza Avanzate
Integrazione di Dataiku DSS con il Cloud
Risoluzione dei Problemi
Riepilogo e Conclusione
Requisiti
- Esperienza con i linguaggi di programmazione Python, SQL e R
- Conoscenze basilari di elaborazione dati con Apache Hadoop e Spark
- Comprensione dei concetti di machine learning e dei modelli di dati
- Formazione nelle analisi statistiche e nei concetti della data science
- Esperienza nella visualizzazione e comunicazione dei dati
Pubblico di Riferimento
- Ingegneri
- Data Scientists
- Data Analysts