Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.
Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.
Struttura del corso
Introduzione
- Comprensione dell'importanza della preparazione dei dati nell'analisi e nel machine learning
- Pipeline di preparazione dei dati e il suo ruolo nel ciclo di vita dei dati
- Esporzione delle sfide comuni nei dati grezzi e l'impatto sull'analisi
Raccolta e Acquisizione dei Dati
- Sorgenti di dati: database, API, fogli di calcolo, file di testo e altro ancora
- Tecniche per la raccolta dei dati e garantire la qualità durante la raccolta
- Raccolta di dati da varie sorgenti
Tecniche di Pulizia dei Dati
- Identificazione e gestione dei valori mancanti, outliers e incongruenze
- Gestione delle duplicazioni ed errori nel dataset
- Pulizia di dataset del mondo reale
Trasformazione e Standardizzazione dei Dati
- Tecniche di normalizzazione e standardizzazione dei dati
- Gestione dei dati categorici: codifica, binning e ingegneria delle caratteristiche
- Trasformazione dei dati grezzi in formati utilizzabili
Integrazione e Aggregazione dei Dati
- Unione e combinazione di dataset da fonti diverse
- Risoluzione delle conflitti nei dati e allineamento dei tipi di dati
- Tecniche per l'aggregazione e la consolidazione dei dati
Garanzia della Qualità dei Dati
- Metodi per garantire la qualità e l'integrità dei dati durante tutto il processo
- Implementazione di controlli qualitativi e procedure di validazione
- Casi studio e applicazioni pratiche della garanzia della qualità dei dati
Riduzione della Dimensionalità e Selezione delle Caratteristiche
- Comprensione del bisogno di riduzione della dimensionalità
- Tecniche come PCA, selezione delle caratteristiche e strategie di riduzione
- Implementazione di tecniche di riduzione della dimensionalità
Riassunto e Prossimi Passaggi
Requisiti
- Comprensione di base dei concetti di dati
Pubblico di Riferimento
- Analisti di dati
- Amministratori di database
- Professionisti IT
14 Ore
Recensioni (2)
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Corso - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.