Struttura del corso
Introduzione al Machine Learning
- Tipi di machine learning – supervisionato vs non supervisionato
- Dall'apprendimento statistico al machine learning
- Il workflow di data mining: comprensione del business, preparazione dei dati, modellazione, deployment
- Scelta dell'algoritmo giusto per il compito
- Overfitting e tradeoff tra bias e varianza
Panoramica di Python e librerie ML
- Perché usare i linguaggi di programmazione per il machine learning
- Scelta tra R e Python
- Corso accelerato di Python e Jupyter Notebooks
- Librerie Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Test e valutazione degli algoritmi ML
- Generalizzazione, overfitting e validazione del modello
- Strategie di valutazione: holdout, cross-validation, bootstrapping
- Metriche per la regressione: ME, MSE, RMSE, MAPE
- Metriche per la classificazione: accuratezza, matrice di confusione, classi sbilanciate
- Visualizzazione delle prestazioni del modello: curva profitto, curva ROC, curva lift
- Selezione del modello e ricerca griglia per l'ottimizzazione
Preparazione dei dati
- Importazione e archiviazione dei dati in Python
- Analisi esplorativa e statistiche riassuntive
- Gestione dei valori mancanti e degli outlier
- Standardizzazione, normalizzazione e trasformazione
- Recoding di dati qualitativi e data wrangling con pandas
Algoritmi di classificazione
- Classificazione binaria vs multiclasse
- Regressione logistica e funzioni discriminanti
- Naïve Bayes, k-nearest neighbors
- Alberi decisionali: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines e kernel
- Tecniche di ensemble learning
Regressione e previsione numerica
- Minimi quadrati e selezione delle variabili
- Metodi di regolarizzazione: L1, L2
- Regressione polinomiale e modelli non lineari
- Alberi decisionali per la regressione e splines
Reti neurali
- Introduzione alle reti neurali e al deep learning
- Funzioni di attivazione, livelli e backpropagation
- Multilayer perceptrons (MLP)
- Uso di TensorFlow o PyTorch per la modellazione delle reti neurali di base
- Reti neurali per classificazione e regressione
Previsione delle vendite e analisi predittive
- Previsione basata su serie temporali vs regressione
- Gestione dei dati stagionali e trend-based
- Costruzione di un modello di previsione delle vendite utilizzando tecniche ML
- Valutazione dell'accuratezza della previsione e incertezza
- Interpretazione e comunicazione dei risultati in ambito aziendale
Apprendimento non supervisionato
- Tecniche di clustering: k-means, k-medoids, clustering gerarchico, SOMs
- Riduzione della dimensionalità: PCA, analisi fattoriale, SVD
- Scaling multidimensionale
Mining del testo
- Preprocessing e tokenizzazione del testo
- Bag-of-words, stemming e lemmatization
- Analisi dell'opinione e frequenza delle parole
- Visualizzazione dei dati di testo con word clouds
Sistemi di raccomandazione
- Filtraggio collaborativo basato sull'utente e sull'elemento
- Progettazione e valutazione dei motori di raccomandazione
Mining dei pattern associativi
- Insiemi frequenti e algoritmo Apriori
- Analisi del carrello della spesa e rapporto di lift
Rilevamento degli outlier
- Analisi dei valori estremi
- Metodi basati sulla distanza e sulle densità
- Rilevamento degli outlier in dati ad alta dimensionalità
Caso di studio di machine learning
- Comprensione del problema aziendale
- Preprocessing dei dati e ingegneria delle feature
- Selezione del modello e tuning dei parametri
- Valutazione e presentazione dei risultati
- Deployment
Riepilogo e passi successivi
Requisiti
- Conoscenze di base dei concetti di machine learning, come apprendimento supervisionato e non supervisionato
- Familiarità con la programmazione Python (variabili, cicli, funzioni)
- Alcuna esperienza nell'elaborazione dei dati utilizzando librerie come pandas o NumPy è utile ma non richiesta
- Non si richiede alcuna esperienza precedente con modelli avanzati o reti neurali
Pubblico di riferimento
- Data scientists
- Analisti aziendali
- Ingegneri software e professionisti tecnici che lavorano con i dati
Recensioni (2)
l'ecosistema ML non riguarda solo MLFlow, ma anche Optuna, Hyperopt, Docker e Docker-Compose
Guillaume GAUTIER - OLEA MEDICAL
Corso - MLflow
Traduzione automatica
Ho trovato molto piacevole partecipare alla formazione su Kubeflow, che si è svolta a distanza. Questa formazione mi ha permesso di consolidare le mie conoscenze sui servizi AWS, K8s e tutte le tool DevOps associate a Kubeflow, che costituiscono le basi necessarie per affrontare l'argomento in modo appropriato. Desidero ringraziare Malawski Marcin per la sua pazienza e professionalità nel fornire formazione e consigli sulle best practice. Malawski affronta l'argomento da diverse angolazioni, utilizzando diversi strumenti di distribuzione come Ansible, EKS kubectl e Terraform. Ora sono definitivamente convinto che mi sto muovendo nel campo d'applicazione giusto.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Corso - Kubeflow
Traduzione automatica