Struttura del corso

Introduzione a Huawei CloudMatrix

  • Ecosistema e flusso di distribuzione di CloudMatrix
  • Modelli, formati e modalità di distribuzione supportati
  • Casistiche tipiche e chipsets supportati

Preparazione dei modelli per la distribuzione

  • Esportazione del modello da strumenti di addestramento (MindSpore, TensorFlow, PyTorch)
  • Uso di ATC (Ascend Tensor Compiler) per la conversione dei formati
  • Modelli con forma statica vs dinamica

Distribuzione in CloudMatrix

  • Creazione del servizio e registrazione del modello
  • Distribuzione dei servizi di inferenza tramite interfaccia utente o CLI
  • Routing, autenticazione e controllo degli accessi

Servizio delle richieste di inferenza

  • Flussi di inferenza batch vs in tempo reale
  • Pipeline di preprocessamento e postprocessamento dei dati
  • Invocazione dei servizi CloudMatrix da applicazioni esterne

Monitoraggio e ottimizzazione delle prestazioni

  • Log di distribuzione e tracciamento delle richieste
  • Scalabilità dei risorse e bilanciamento del carico
  • Ottimizzazione della latenza e dell'attraversamento

Integrazione con strumenti aziendali

  • Connessione di CloudMatrix con OBS e ModelArts
  • Uso dei flussi di lavoro e della versioning del modello
  • CI/CD per la distribuzione e il rollback del modello

Pipeline end-to-end di inferenza

  • Distribuzione di una pipeline completa di classificazione delle immagini
  • Benchmarking e verifica dell'accuratezza
  • Simulazione del failover e degli avvisi del sistema

Riepilogo e passaggi successivi

Requisiti

  • Comprendere i flussi di lavoro per l'addestramento dei modelli AI
  • Esperienza con framework ML basati su Python
  • Familiarità di base con i concetti di deploy in cloud

Target dell'audience

  • Team AI ops
  • Ingegneri di machine learning
  • Specialisti in deploy cloud che lavorano con infrastrutture Huawei
 21 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (1)

Corsi in Arrivo

Categorie relative