Struttura del corso

Machine Learning Introduzione

  • Tipi di apprendimento automatico – supervisionato vs non supervisionato
  • Dall'apprendimento statistico all'apprendimento automatico
  • Il workflow della data mining: comprensione aziendale, preparazione dei dati, modellazione, implementazione
  • Scegliere l'algoritmo giusto per il compito
  • Overfitting e il compromesso tra bias-varianza

Python e Panoramica delle librerie ML

  • Perché usare linguaggi di programmazione per ML
  • Scegliere tra R e Python
  • Breve introduzione a Python e Jupyter Notebooks
  • Librerie Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Test e Valutazione degli Algoritmi di ML

  • Generalizzazione, overfitting e validazione del modello
  • Strategie di valutazione: holdout, cross-validation, bootstrapping
  • Metriche per la regressione: ME, MSE, RMSE, MAPE
  • Metriche per la classificazione: accuratezza, matrice di confusione, classi sbilanciate
  • Visualizzazione delle prestazioni del modello: curva profitto, ROC curve, curva lift
  • Scegliere il modello e grid search per l'ottimizzazione

Preparazione dei Dati

  • Importare e archiviare dati in Python
  • Analisi esplorativa e statistiche descrittive
  • Gestire valori mancanti e outliers
  • Standardizzazione, normalizzazione e trasformazione
  • Ricodificare i dati qualitativi e data wrangling con pandas

Algoritmi di Classificazione

  • Classificazione binaria vs multiclasse
  • Regressione logistica e funzioni discriminanti
  • Naïve Bayes, k-nearest neighbors
  • Alberi decisionali: CART, Random Forests, Bagging, Boosting, XGBoost
  • Machines a Vettori di Supporto (SVM) e kernel
  • Tecniche di apprendimento ensemblistico

Regressione e Predizione Numerica

  • Minimi quadrati e selezione delle variabili
  • Metodi di regolarizzazione: L1, L2
  • Regressione polinomiale e modelli non lineari
  • Alberi decisionali per la regressione e spline

Neural Networks

  • Introduzione ai neuroni e al deep learning
  • Funzioni di attivazione, strati e retropropagazione
  • Multilayer perceptrons (MLP)
  • Utilizzare TensorFlow o PyTorch per la modellazione di reti neurali di base
  • Rete neurale per classificazione e regressione

Predizione delle Vendite Forecasting e Predictive Analytics

  • Previsione basata sulle serie temporali vs la regressione
  • Gestire dati stagionali e basati su tendenze
  • Costruire un modello di previsione delle vendite utilizzando tecniche ML
  • Valutare l'accuratezza e l'incertezza della previsione
  • Interpretazione e comunicazione dei risultati Business

Unsupervised Learning

  • Tecniche di clustering: k-means, k-medoids, clustering gerarchico, SOMs
  • Riduzione della dimensionalità: PCA, analisi fattoriale, SVD
  • Scaling multidimensionale

Mining del Testo

  • Preliminari di testo e tokenizzazione
  • Bag-of-words, stemming e lemmatization
  • Analisi delle opinioni e frequenza delle parole
  • Visualizzare i dati di testo con nuvole di parole

Sistemi di Recommondazione

  • Filtraggio collaborativo basato sull'utente vs l'oggetto
  • Disegnare e valutare motori di raccomandazione

Mining delle Pattern Associative

  • Insediamenti frequenti e algoritmo Apriori
  • Analisi del carrello dei prodotti e rapporto lift

Detezione degli Outlier

  • Analisi di valori estremi
  • Metodi basati sulla distanza e la densità
  • Detezione degli outlier in dati ad alta dimensionalità

Machine Learning Caso di Studio

  • Comprensione del problema aziendale
  • Preliminari dei dati e ingegneria delle caratteristiche
  • Scegliere il modello e l'ottimizzazione dei parametri
  • Valutazione e presentazione dei risultati
  • Implementazione

Riepilogo e Passaggi Successivi

Requisiti

  • Nozioni di base sui concetti di apprendimento automatico come l'apprendimento supervisionato e non supervisionato
  • Familiarità con la programmazione Python (variabili, cicli, funzioni)
  • Alcune esperienze nell'elaborazione dei dati utilizzando librerie come pandas o NumPy sono utili ma non obbligatorie
  • Non è prevista alcuna esperienza precedente con modelli avanzati o reti neurali

Pubblico

  • Scienziati dei dati
  • Analisti Business
  • Ingegneri software e professionisti tecnici che lavorano con i dati
 28 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (2)

Corsi in Arrivo

Categorie relative