Struttura del corso
Pre-elaborazione dei dati
Data Cleaning
Integrazione e trasformazione dei dati
Riduzione dei dati
Discretizzazione e generazione di gerarchie concettuali
Inferenza statistica
Distribuzioni di probabilità, Variabili aleatorie, Teorema del limite centrale
Campionamento
Intervalli di confidenza
Inferenza statistica
Verifica delle ipotesi
Regressione lineare multivariata
Specificazione
Selezione di sottoinsiemi
Valutazione
Convalida
Predizione
Metodi di classificazione
Regressione logistica
Analisi discriminante lineare
K-vicini più prossimi
Ingenuo Bayes
Confronto tra i metodi di classificazione
Neural Networks
Adattamento di reti neurali
Problemi relativi alle reti neurali di addestramento
Alberi decisionali
Alberi di regressione
Alberi di classificazione
Alberi e modelli lineari a confronto
Insaccamento, Random Forests, Potenziamento
Insaccamento
Random Forests
Aumentare
Supporta le macchine vettoriali e il disct flessibile
Classificatore del margine massimo
Classificatori vettoriali di supporto
Macchine vettoriali di supporto
2 e più classi SVM
Relazione con la regressione logistica
Analisi delle componenti principali
Clustering
Clustering K-means
Raggruppamento di K-medoidi
Clustering gerarchico
Clustering basato sulla densità
Valutazione e selezione del modello
Distorsione, varianza e complessità del modello
Errore di previsione nel campione
L'approccio bayesiano
Convalida incrociata
Bootstrap metodi