Struttura del corso

Introduzione

  • Comprendere l'importanza della preparazione dei dati nell'analisi e nell'apprendimento automatico
  • La pipeline di preparazione dei dati e il suo ruolo nel ciclo di vita dei dati
  • Esplorare le sfide comuni nei dati grezzi e l'impatto sull'analisi

Raccolta e acquisizione dei dati

  • Fonti di dati: database, API, fogli di calcolo, file di testo e altro ancora
  • Tecniche per la raccolta dei dati e la garanzia della qualità dei dati durante la raccolta
  • Raccolta di dati da varie fonti

Data Cleaning Tecniche

  • Identificazione e gestione dei valori mancanti, dei valori anomali e delle incoerenze
  • Gestione di duplicati ed errori nel set di dati
  • Pulizia di set di dati reali

Trasformazione e standardizzazione dei dati

  • Tecniche di normalizzazione e standardizzazione dei dati
  • Gestione categorica dei dati: codifica, binning e progettazione di funzionalità
  • Trasformare i dati grezzi in formati utilizzabili

Data Integration e Aggregazione

  • Unione e combinazione di set di dati provenienti da fonti diverse
  • Risoluzione dei conflitti di dati e allineamento dei tipi di dati
  • Tecniche per l'aggregazione e il consolidamento dei dati

Data Quality Assicurazione

  • Metodi per garantire la qualità e l'integrità dei dati durante tutto il processo
  • Implementazione di controlli di qualità e procedure di convalida
  • Casi di studio e applicazioni pratiche dell'assicurazione della qualità dei dati

Riduzione della dimensionalità e selezione delle feature

  • Comprendere la necessità di ridurre la dimensionalità
  • Tecniche come PCA, selezione delle caratteristiche e strategie di riduzione
  • Implementazione di tecniche di riduzione della dimensionalità

Riepilogo e prossime tappe

Requisiti

    Comprensione di base dei concetti relativi ai dati

Pubblico

    Analisti di dati Database Amministratori Professionisti IT
 14 ore

Numero di Partecipanti



Prezzo per Partecipante

Recensioni (2)

Corsi relativi

Categorie relative