Struttura del corso

Spark.mllib: tipi di dati, algoritmi e utilità

    Tipi di dati Statistiche di base Statistiche di riepilogo Correlazioni campionamento stratificato verifica delle ipotesi Test di significatività dello streaming Generazione di dati casuali
Classificazione e regressione modelli lineari (SVM, regressione logistica, regressione lineare)
  • barnalegur Bayes
  • Alberi decisionali
  • insiemi di alberi (Random Forests e alberi con gradiente potenziato)
  • regressione isotonica
  • Filtraggio collaborativo minimi quadrati alternati (ALS)
  • Clustering k-mezzi
  • Miscela gaussiana
  • cluster di iterazione di potenza (PIC)
  • Indennità di Dirichlet latente (LDA)
  • bisettrice K-media
  • streaming k-mezzi
  • Riduzione della dimensionalità decomposizione a valore singolare (SVD)
  • analisi delle componenti principali (PCA)
  • Estrazione e trasformazione di feature
  • Pattern mining frequente Crescita FP
  • Regole dell'associazione
  • PrefissoSpan
  • Metriche di valutazione
  • Esportazione del modello PMML
  • Ottimizzazione (sviluppatore) Discesa del gradiente stocastico
  • BFGS A MEMORIA LIMITATA (L-BFGS)
  • spark.ml: API di alto livello per pipeline di Machine Learning
  • Panoramica: stimatori, trasformatori e tubazioni Estrazione, trasformazione e selezione di feature Classificazione e regressione Clustering Argomenti avanzati

    Requisiti

    Conoscenza di uno dei seguenti argomenti:

    • Giava
    • Scala
    • pitone
    • SparkR.
      35 ore
     

    Numero di Partecipanti


    Data Inizio

    Data Fine


    Dates are subject to availability and take place between 09:30 and 16:30.
    I corsi di formazione pubblici richiedono più di 5 partecipanti.

    Recensioni (8)

    Corsi relativi

    Categorie relative