Struttura del corso

Introduzione

Installazione e configurazione di Dataiku Data Science Studio (DSS)

  • Requisiti di sistema per Dataiku DSS
  • Configurazione delle integrazioni di Apache Hadoop e Apache Spark
  • Configurazione di Dataiku DSS con proxy Web
  • Migrazione da altre piattaforme a Dataiku DSS

Panoramica delle funzionalità e dell'architettura di Dataiku DSS

  • Oggetti e grafi di base fondamentali per Dataiku DSS
  • Che cos'è una ricetta in Dataiku DSS?
  • Tipi di set di dati supportati da Dataiku DSS

Creazione di un progetto Dataiku DSS

Definizione di set di dati per la connessione alle risorse di dati in Dataiku DSS

  • Utilizzo dei connettori DSS e dei formati di file
  • Formati DSS standard e formati specifici per Hadoop
  • Caricamento di file per un progetto Dataiku DSS

Panoramica del file system del server in Dataiku DSS

Creazione e utilizzo di cartelle gestite

  • Ricetta Dataiku DSS per unire la cartella
  • Cartelle gestite locali e non locali

Costruzione di un set di dati del file system utilizzando il contenuto delle cartelle gestite

  • Esecuzione di pulizie con una ricetta di codice DSS

Utilizzo del set di dati delle metriche e del set di dati delle statistiche interne

Implementazione della ricetta di download DSS per il set di dati HTTP

Rilocazione SQL di set di dati e set di dati HDFS tramite DSS

Ordinamento dei set di dati in Dataiku DSS

  • Ordinamento del writer e ordinamento in fase di lettura

Esplorazione e preparazione di oggetti visivi dati per un progetto Dataiku DSS

Panoramica degli schemi, dei tipi di archiviazione e dei significati di Dataiku

Esecuzione di script di pulizia, normalizzazione e arricchimento dei dati in Dataiku DSS

Utilizzo dell'interfaccia dei grafici Dataiku DSS e dei tipi di aggregazioni visive

Utilizzo della funzione interattiva Statistics di DSS

  • Analisi univariata vs. analisi bivariata
  • Utilizzo dello strumento DSS per l'analisi delle componenti principali (PCA)

Panoramica di Machine Learning con Dataiku DSS

  • Confronto tra ML supervisionato e ML non supervisionato
  • Riferimenti per la gestione degli algoritmi e delle funzionalità di DSS ML
  • Deep Learning con Dataiku DSS

Panoramica del flusso derivato da set di dati e ricette DSS

Trasformazione di set di dati esistenti in DSS con ricette visive

Utilizzo di ricette DSS basate su codice definito dall'utente

Ottimizzazione dell'esplorazione e della sperimentazione del codice con i notebook di codice DSS

Scrittura di visualizzazioni DSS avanzate e funzionalità frontend personalizzate con le app Web

Utilizzo della funzione Dataiku DSS Code Reports

Condivisione dei progetti di dati Element e familiarizzazione con il dashboard DSS

Progettazione e creazione di pacchetti di un progetto Dataiku DSS come applicazione riutilizzabile

Panoramica dei metodi avanzati in Dataiku DSS

  • Implementazione del partizionamento ottimizzato dei set di dati tramite DSS
  • Esecuzione di parti specifiche di elaborazione DSS tramite calcoli in Kubernetes contenitori

Panoramica di Collaboration e controllo della versione in Dataiku DSS

Implementazione di scenari, metriche e controlli di automazione per il test dei progetti DSS

Distribuzione e aggiornamento di un progetto con il nodo e i bundle di automazione DSS

Utilizzo delle API in tempo reale in Dataiku DSS

  • API aggiuntive e API REST in DSS

Analisi e Forecasting Dataiku DSS Time Series

Protezione di un progetto in Dataiku DSS

  • Gestione delle autorizzazioni di progetto e delle autorizzazioni del dashboard
  • Implementazione di opzioni di sicurezza avanzate

Integrazione di Dataiku DSS con il cloud

Risoluzione dei problemi

Riassunto e conclusione

Requisiti

  • Esperienza con i linguaggi di programmazione Python, SQL e R
  • Conoscenza di base dell'elaborazione dei dati con Apache Hadoop e Spark
  • Comprensione dei concetti di machine learning e dei modelli di dati
  • Background in analisi statistica e concetti di data science
  • Esperienza nella visualizzazione e nella comunicazione dei dati

Pubblico

  • ingegneri
  • Scienziati dei dati
  • Analisti di dati
 21 ore

Numero di Partecipanti



Prezzo per Partecipante

Corsi relativi

Categorie relative