Struttura del corso

Panoramica delle Capacità di Ottimizzazione CANN

  • Come si gestisce le prestazioni di inferenza in CANN
  • Oggetti di ottimizzazione per sistemi AI edge e embedded
  • Comprensione dell'utilizzo del nucleo AI e della allocazione della memoria

Utilizzo dell'Engine Grafico per l'Analisi

  • Introduzione all'Engine Grafico e alla pipeline di esecuzione
  • Visualizzazione dei grafici operatori e delle metriche di runtime
  • Modifica dei grafici computazionali per l'ottimizzazione

Strumenti di Profiling e Metriche di Prestazioni

  • Utilizzo dello Strumento di Profilazione CANN (profiler) per l'analisi dei carichi di lavoro
  • Analisi del tempo di esecuzione del kernel e delle bottlenecks
  • Profilazione dell'accesso alla memoria e strategie di tiling

Sviluppo di Operatori Custom con TIK

  • Panoramica di TIK e del modello di programmazione degli operatori
  • Implementazione di un operatore custom utilizzando la DSL TIK
  • Test e benchmarking delle prestazioni dell'operatore

Ottimizzazione Avanzata degli Operatori con TVM

  • Introduzione all'integrazione di TVM con CANN
  • Strategie di auto-tuning per i grafici computazionali
  • Quando e come passare da TVM a TIK

Tecniche di Ottimizzazione della Memoria

  • Gestione dell'allocazione dei buffer e del layout della memoria
  • Tecnologie per ridurre il consumo di memoria on-chip
  • Best practice per l'esecuzione asincrona e la riuso

Missioni Mondiali e Studi di Caso

  • Studio di caso: ottimizzazione delle prestazioni del pipeline della videocamera della smart city
  • Studio di caso: ottimizzazione dello stack di inferenza dell'auto autonoma
  • Linedirlineguideline per il profilo iterativo e miglioramento continuo

Riassunto e Passaggi Successivi

Requisiti

  • Comprensione solida delle architetture dei modelli di deep learning e dei flussi di lavoro di addestramento
  • Esperienza nel deployment dei modelli utilizzando CANN, TensorFlow o PyTorch
  • Familiarità con il CLI di Linux, lo scripting shell e la programmazione in Python

Pubblico

  • Ingegneri delle prestazioni AI
  • Specialisti dell'ottimizzazione inferenziale
  • Sviluppatori che lavorano con l'AI di edge o sistemi in tempo reale
 14 ore

Numero di Partecipanti


Prezzo per Partecipante

Corsi in Arrivo

Categorie relative