Struttura del corso
Machine Learning Introduzione
- Tipi di apprendimento automatico – supervisionato vs non supervisionato
- Dall'apprendimento statistico all'apprendimento automatico
- Il workflow della data mining: comprensione aziendale, preparazione dei dati, modellazione, implementazione
- Scegliere l'algoritmo giusto per il compito
- Overfitting e il compromesso tra bias-varianza
Python e Panoramica delle librerie ML
- Perché usare linguaggi di programmazione per ML
- Scegliere tra R e Python
- Breve introduzione a Python e Jupyter Notebooks
- Librerie Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Test e Valutazione degli Algoritmi di ML
- Generalizzazione, overfitting e validazione del modello
- Strategie di valutazione: holdout, cross-validation, bootstrapping
- Metriche per la regressione: ME, MSE, RMSE, MAPE
- Metriche per la classificazione: accuratezza, matrice di confusione, classi sbilanciate
- Visualizzazione delle prestazioni del modello: curva profitto, ROC curve, curva lift
- Scegliere il modello e grid search per l'ottimizzazione
Preparazione dei Dati
- Importare e archiviare dati in Python
- Analisi esplorativa e statistiche descrittive
- Gestire valori mancanti e outliers
- Standardizzazione, normalizzazione e trasformazione
- Ricodificare i dati qualitativi e data wrangling con pandas
Algoritmi di Classificazione
- Classificazione binaria vs multiclasse
- Regressione logistica e funzioni discriminanti
- Naïve Bayes, k-nearest neighbors
- Alberi decisionali: CART, Random Forests, Bagging, Boosting, XGBoost
- Machines a Vettori di Supporto (SVM) e kernel
- Tecniche di apprendimento ensemblistico
Regressione e Predizione Numerica
- Minimi quadrati e selezione delle variabili
- Metodi di regolarizzazione: L1, L2
- Regressione polinomiale e modelli non lineari
- Alberi decisionali per la regressione e spline
Neural Networks
- Introduzione ai neuroni e al deep learning
- Funzioni di attivazione, strati e retropropagazione
- Multilayer perceptrons (MLP)
- Utilizzare TensorFlow o PyTorch per la modellazione di reti neurali di base
- Rete neurale per classificazione e regressione
Predizione delle Vendite Forecasting e Predictive Analytics
- Previsione basata sulle serie temporali vs la regressione
- Gestire dati stagionali e basati su tendenze
- Costruire un modello di previsione delle vendite utilizzando tecniche ML
- Valutare l'accuratezza e l'incertezza della previsione
- Interpretazione e comunicazione dei risultati Business
Unsupervised Learning
- Tecniche di clustering: k-means, k-medoids, clustering gerarchico, SOMs
- Riduzione della dimensionalità: PCA, analisi fattoriale, SVD
- Scaling multidimensionale
Mining del Testo
- Preliminari di testo e tokenizzazione
- Bag-of-words, stemming e lemmatization
- Analisi delle opinioni e frequenza delle parole
- Visualizzare i dati di testo con nuvole di parole
Sistemi di Recommondazione
- Filtraggio collaborativo basato sull'utente vs l'oggetto
- Disegnare e valutare motori di raccomandazione
Mining delle Pattern Associative
- Insediamenti frequenti e algoritmo Apriori
- Analisi del carrello dei prodotti e rapporto lift
Detezione degli Outlier
- Analisi di valori estremi
- Metodi basati sulla distanza e la densità
- Detezione degli outlier in dati ad alta dimensionalità
Machine Learning Caso di Studio
- Comprensione del problema aziendale
- Preliminari dei dati e ingegneria delle caratteristiche
- Scegliere il modello e l'ottimizzazione dei parametri
- Valutazione e presentazione dei risultati
- Implementazione
Riepilogo e Passaggi Successivi
Requisiti
- Nozioni di base sui concetti di apprendimento automatico come l'apprendimento supervisionato e non supervisionato
- Familiarità con la programmazione Python (variabili, cicli, funzioni)
- Alcune esperienze nell'elaborazione dei dati utilizzando librerie come pandas o NumPy sono utili ma non obbligatorie
- Non è prevista alcuna esperienza precedente con modelli avanzati o reti neurali
Pubblico
- Scienziati dei dati
- Analisti Business
- Ingegneri software e professionisti tecnici che lavorano con i dati
Recensioni (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Corso - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.