Struttura del corso

Introduzione

  • Comprendere l'importanza della preparazione dei dati nell'analisi e nell'apprendimento automatico
  • La pipeline di preparazione dei dati e il suo ruolo nel ciclo di vita dei dati
  • Esplorare le sfide comuni nei dati grezzi e l'impatto sull'analisi

Raccolta e acquisizione dei dati

  • Fonti di dati: database, API, fogli di calcolo, file di testo e altro ancora
  • Tecniche per la raccolta dei dati e la garanzia della qualità dei dati durante la raccolta
  • Raccolta di dati da varie fonti

Data Cleaning Tecniche

  • Identificazione e gestione dei valori mancanti, dei valori anomali e delle incoerenze
  • Gestione di duplicati ed errori nel set di dati
  • Pulizia di set di dati reali

Trasformazione e standardizzazione dei dati

  • Tecniche di normalizzazione e standardizzazione dei dati
  • Gestione categorica dei dati: codifica, binning e progettazione di funzionalità
  • Trasformare i dati grezzi in formati utilizzabili

Data Integration e Aggregazione

  • Unione e combinazione di set di dati provenienti da fonti diverse
  • Risoluzione dei conflitti di dati e allineamento dei tipi di dati
  • Tecniche per l'aggregazione e il consolidamento dei dati

Data Quality Assicurazione

  • Metodi per garantire la qualità e l'integrità dei dati durante tutto il processo
  • Implementazione di controlli di qualità e procedure di convalida
  • Casi di studio e applicazioni pratiche dell'assicurazione della qualità dei dati

Riduzione della dimensionalità e selezione delle feature

  • Comprendere la necessità di ridurre la dimensionalità
  • Tecniche come PCA, selezione delle caratteristiche e strategie di riduzione
  • Implementazione di tecniche di riduzione della dimensionalità

Riepilogo e prossime tappe

Requisiti

  • Comprensione di base dei concetti dati

Pubblico

  • Analisti di dati
  • Database amministratori
  • Professionisti IT
 14 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (2)

Corsi in Arrivo

Categorie relative