Pagina Principale
Computer Graphics Corso
GPU Corso
Corso di formazione Programmazione GPU con OpenACC

Corso di formazione Programmazione GPU con OpenACC

OpenACC è uno standard aperto per la programmazione eterogenea che consente a un codice di eseguirsi su diverse piattaforme e dispositivi, come CPU multicore, GPU, FPGA e altri.

Questa formazione guidata dal docente (online o in sede) è rivolta a sviluppatori di livello principiante o intermedio che desiderano utilizzare OpenACC per programmare dispositivi eterogenei e sfruttare il loro parallelismo.

Al termine di questa formazione, i partecipanti saranno in grado di:

Configurare un ambiente di sviluppo OpenACC.
Scrivere ed eseguire un programma di base con OpenACC.
Annotare il codice con direttive e clausole OpenACC.
Utilizzare le API e le librerie OpenACC.
Profilare, debuggare e ottimizzare i programmi OpenACC.

Formato del Corso

Lezione interattiva e discussione.
Numerosi esercizi e pratica.
Implementazione pratica in un ambiente di laboratorio live.

Opzioni di Personalizzazione del Corso

Per richiedere una formazione personalizzata per questo corso, contattateci per organizzare.

Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.

Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.

Struttura del corso

Introduzione

Cos'è OpenACC?
OpenACC vs OpenCL vs CUDA vs SYCL
Panoramica delle funzionalità e dell'architettura di OpenACC
Configurazione dell'ambiente di sviluppo

Iniziamo

Creare un progetto OpenACC in Visual Studio Code
Esplorare la struttura del progetto e i file
Compilare ed eseguire il programma
Visualizzare l'output con printf e fprintf

Direttive e Clausole OpenACC

Capire le direttive e le clausole di OpenACC
Utilizzare direttive parallele per creare regioni parallele
Utilizzare direttive kernel per il parallelismo gestito dal compilatore
Utilizzare direttive loop per parallelizzare i cicli
Gestire il movimento dei dati con direttive data
Sincronizzare i dati con direttive update
Migliorare la riutilizzabilità dei dati con direttive cache
Creare funzioni di dispositivo con direttive routine
Sincronizzare gli eventi con direttive wait

API OpenACC

Capire il ruolo dell'API OpenACC
Ricerche informazioni e capacità del dispositivo
Impostare il numero e il tipo di dispositivo
Gestire errori ed eccezioni
Creare e sincronizzare eventi

Librerie OpenACC e Interoperabilità

Capire le librerie e l'interoperabilità di OpenACC
Utilizzare librerie matematiche, random e complesse
Integrare con altri modelli (CUDA, OpenMP, MPI)
Integrare con librerie GPU (cuBLAS, cuFFT)

Strumenti OpenACC

Capire gli strumenti di sviluppo OpenACC
Profilare e debuggare programmi OpenACC
Analisi delle prestazioni con PGI Compiler, NVIDIA Nsight Systems, Allinea Forge

Ottimizzazione

Fattori che influiscono sulle prestazioni di un programma OpenACC
Ottimizzare la località dei dati e ridurre i trasferimenti
Ottimizzare il parallelismo e la fusione dei loop
Ottimizzare il parallelismo e la fusione dei kernel
Ottimizzare la vettorizzazione e l'autotuning

Riassunto e Passi Successivi

Requisiti

Conoscenza della lingua C/C++ o Fortran e dei concetti di programmazione parallela
Nozioni di base dell'architettura del computer e della gerarchia della memoria
Esperienza con strumenti da riga di comando e editor di codice

Pubblico Obiettivo

Sviluppatori che desiderano imparare a utilizzare OpenACC per programmare dispositivi eterogenei e sfruttarne il parallelismo
Sviluppatori che desiderano scrivere codice portatile e scalabile che possa eseguirsi su diverse piattaforme e dispositivi
Programmatori che desiderano esplorare gli aspetti di alto livello della programmazione eterogenea e ottimizzare la produttività del proprio codice

28 ore

Numero di Partecipanti

Interaziendale

Privato - online/onsite

Selezionare la località

Selezionare una sede

Prezzo per partecipante

I corsi di formazione interaziendali richiedono più di 5 partecipanti.

Corso di formazione Programmazione GPU con OpenACC - Prenotazione

Nome e Cognome *

Email *

Telefono *

Titolo professionale

Nome della società

Indirizzo 1 *

Città *

Stato/Provincia

Paese *

Codice Postale *

Data d'inizio

CF / P. IVA

Le date sono soggette a disponibilità e si svolgono tra 09:30 e 16:30.

Pagamento *

Bonifico bancario (fattura, ODA)

Carta di debito / credito

Commenti

Termini e Condizioni *

Sono un rappresentante autorizzato del cliente sopra indicato e desidero prenotare i corsi o i servizi di cui sopra in conformità con i termini e le condizioni e la politica sulla privacy di NobleProg.

Informarmi su sconti e promozioni

Per favore leggi la nostra Informativa sulla privacy per sapere come utilizziamo i tuoi dati.

Corso di formazione Programmazione GPU con OpenACC - Richiesta

Nome e Cognome *

Email *

Telefono *

Numero di Partecipanti

Nome della società

Indirizzo della società

Come vuoi seguire il corso?

Premises del Cliente

Online

Classe

Commenti

Informarmi su sconti e promozioni

Per favore leggi la nostra Informativa sulla privacy per sapere come utilizziamo i tuoi dati.

Programmazione GPU con OpenACC - Richiesta di consulenza

Richiesta di consulenza

Nome e Cognome *

Telefono *

Email *

Nome della società

Oggetto della consulenza *

Obiettivo della consulenza

Con chi lavorerà il consulente?

Sviluppo di Applicazioni AI con Huawei Ascend e CANN

21 ore

Huawei Ascend è una famiglia di processori AI progettati per il calcolo ad alta prestazione in inferenza e training.

Questo corso guidato da un docente (online o sul posto) è rivolto a ingegneri AI e data scientist di livello intermedio che desiderano sviluppare e ottimizzare modelli neurali utilizzando la piattaforma Ascend di Huawei e il toolkit CANN.

Al termine del corso, i partecipanti saranno in grado di:

Configurare l'ambiente di sviluppo CANN.
Sviluppare applicazioni AI utilizzando i flussi di lavoro MindSpore e CloudMatrix.
Ottimizzare le prestazioni su Ascend NPUs utilizzando operatori personalizzati e tiling.
Distribuire modelli in ambienti edge o cloud.

Formato del Corso

Lezione interattiva e discussione.
Utilizzo pratico di Huawei Ascend e CANN toolkit in applicazioni di esempio.
Esercizi guidati focalizzati sulla costruzione, il training e la distribuzione dei modelli.

Opzioni di Personalizzazione del Corso

Per richiedere un corso personalizzato basato sulla vostra infrastruttura o sui vostri dataset, contattateci per organizzarlo.

Ulteriori Informazioni...

Deploying AI Models with CANN e Processori Ascend AI

14 ore

CANN (Compute Architecture for Neural Networks) è lo stack di calcolo AI di Huawei per la distribuzione e l'ottimizzazione dei modelli AI sui processori Ascend.

Questo training live, guidato da un istruttore (online o su sito), è rivolto a sviluppatori ed ingegneri di livello intermedio che desiderano distribuire modelli AI addestrati in modo efficiente sulla hardware Huawei Ascend utilizzando lo strumento CANN e strumenti come MindSpore, TensorFlow, o PyTorch.

Al termine di questo training, i partecipanti saranno in grado di:

Comprendere l'architettura CANN e il suo ruolo nella pipeline di distribuzione AI.
Convertire ed adattare modelli da framework popolari a formati compatibili con Ascend.
Usare strumenti come ATC, OM conversione del modello e MindSpore per inferenza edge e cloud.
Diagnosare problemi di distribuzione ed ottimizzare le prestazioni su hardware Ascend.

Formato del Corso

Lezione interattiva e dimostrativa.
Laboratorio pratico utilizzando gli strumenti CANN e simulatori o dispositivi Ascend.
Scenari di distribuzione pratica basati su modelli AI real-world.

Opzioni per la Personalizzazione del Corso

Per richiedere una formazione personalizzata per questo corso, si prega di contattarci per organizzare.

Ulteriori Informazioni...

GPU Programming su Biren AI Accelerators

21 ore

I Biren AI Accelerators sono GPU ad alte prestazioni progettati per carichi di lavoro AI e HPC, con supporto per il training su larga scala e l'inferenza.

Questo corso interattivo (tenuto online o in sede) è rivolto a sviluppatori di livello intermedio e avanzato che desiderano programmare e ottimizzare applicazioni utilizzando la pila proprietaria Biren GPU, con comparazioni pratiche rispetto agli ambienti basati su CUDA.

Al termine del corso, i partecipanti saranno in grado di:

Comprendere l'architettura e la gerarchia della memoria Biren GPU.
Configurare l'ambiente di sviluppo ed utilizzare il modello di programmazione Biren.
Tradurre e ottimizzare codice in stile CUDA per le piattaforme Biren.
Applicare tecniche di ottimizzazione delle prestazioni e di debug.

Formato del Corso

Lezione interattiva e discussione.
Utilizzo pratico dell'SDK Biren in carichi di lavoro di esempio GPU.
Esercizi guidati focalizzati sulla porting e l'ottimizzazione delle prestazioni.

Opzioni per la Personalizzazione del Corso

Per richiedere un corso personalizzato basato sul vostro stack di applicazioni o sui bisogni di integrazione, contattateci per organizzare.

Ulteriori Informazioni...

Cambricon MLU Development with BANGPy and Neuware

21 ore

Le Cambricon MLUs (Machine Learning Unità) sono chip AI specializzati ottimizzati per l'inferenza e il training in scenari di edge computing e data center.

Questo corso live guidato da un istruttore (online o sul posto) è rivolto a sviluppatori intermedio che desiderano creare e distribuire modelli AI utilizzando il framework BANGPy e l'SDK Neuware sui chip Cambricon MLU.

Al termine di questo corso, i partecipanti saranno in grado di:

Configurare gli ambienti di sviluppo per BANGPy e Neuware.
Sviluppare ed ottimizzare modelli basati su Python e C++ per Cambricon MLUs.
Distribuire i modelli a dispositivi edge e data center che eseguono il runtime Neuware.
Integrare i flussi di lavoro ML con funzionalità di accelerazione specifiche di MLU.

Formato del Corso

Lectura interattiva e discussione.
Utilizzo pratica di BANGPy e Neuware per lo sviluppo e la distribuzione.
Esercizi guidati focalizzati sull'ottimizzazione, l'integrazione e il testing.

Opzioni di Personalizzazione del Corso

Per richiedere un corso personalizzato basato sul vostro modello di dispositivo Cambricon o caso d'uso, contattateci per organizzare la sessione.

Ulteriori Informazioni...

Introduzione a CANN per Sviluppatori di Framework AI

7 ore

CANN (Architettura di Calcolo per Neural Networks) è il kit di strumenti Huawei per il calcolo AI utilizzato per compilare, ottimizzare e distribuire modelli AI sui processori Ascend AI.

Questo addestramento guidato dall'insegnante (online o in sede) si rivolge a sviluppatori AI di livello principiante che desiderano comprendere come CANN si integra nel ciclo di vita del modello, dalla formazione alla distribuzione, e come funziona con i framework come MindSpore, TensorFlow, e PyTorch.

Al termine di questo addestramento, i partecipanti saranno in grado di:

Comprendere lo scopo e l'architettura del kit di strumenti CANN.
Configurare un ambiente di sviluppo con CANN e MindSpore.
Convertire e distribuire un semplice modello AI su hardware Ascend.
Acquisire conoscenze fondamentali per futuri progetti di ottimizzazione o integrazione di CANN.

Formato del Corso

Lezione interattiva e discussione.
Laboratorio pratico con la distribuzione di semplici modelli.
Guida passo-passo della catena strumentale CANN e dei punti di integrazione.

Opzioni per la Personalizzazione del Corso

Per richiedere un addestramento personalizzato per questo corso, si prega di contattarci per organizzare l'evento.

Ulteriori Informazioni...

CANN per Edge AI Deployment

14 ore

Lo strumento Huawei Ascend CANN abilita potenti inferenze AI sui dispositivi di bordo come l'Ascend 310. CANN fornisce strumenti essenziali per compilare, ottimizzare e distribuire modelli in ambienti con limitazioni di calcolo e memoria.

Questa formazione guidata dal formatore (online o sul posto) è rivolta a sviluppatori AI intermedi e integratori che desiderano distribuire ed ottimizzare modelli sui dispositivi di bordo Ascend utilizzando la catena degli strumenti CANN.

Al termine della formazione, i partecipanti saranno in grado di:

Preparare e convertire modelli AI per l'Ascend 310 utilizzando gli strumenti CANN.
Creare pipeline di inferenza leggere utilizzando MindSpore Lite e AscendCL.
Ottimizzare le prestazioni del modello per ambienti limitati in termini di calcolo e memoria.
Distribuire e monitorare applicazioni AI nelle situazioni reali di bordo.

Formato del corso

Lezione interattiva e dimostrativa.
Lavoro pratica con modelli specifici di bordo e scenari.
Esempi viventi di distribuzione su hardware virtuale o fisico di bordo.

Opzioni di personalizzazione del corso

Per richiedere una formazione personalizzata per questo corso, contattateci per organizzare l'incontro.

Ulteriori Informazioni...

Comprendere la Pila di Calcolo AI di Huawei: Dal CANN a MindSpore

14 ore

Lo stack AI di Huawei — dal basso livello CANN SDK al alto livello MindSpore — offre un ambiente integrato per lo sviluppo e il deployment dell'IA ottimizzato per l'hardware Ascend.

Questo corso guidato da istruttore (online o in sito) è rivolto a professionisti tecnici di livello principiante a intermedio che desiderano comprendere come i componenti CANN e MindSpore lavorano insieme per supportare la gestione del ciclo di vita dell'IA e le decisioni di infrastruttura.

Al termine di questo corso, i partecipanti saranno in grado di:

Comprendere l'architettura stratificata dello stack computazionale AI di Huawei.
Identificare come CANN supporta l'ottimizzazione dei modelli e il deployment a livello hardware.
Valutare il framework e lo strumento MindSpore in relazione alle alternative del settore.
Posizionare lo stack AI di Huawei all'interno degli ambienti aziendali o cloud/on-premises.

Formato del Corso

Lezione interattiva e discussione.
Demo di sistema live e walkthrough basati su casi concreti.
Laboratori guidati facoltativi sul flusso del modello da MindSpore a CANN.

Opzioni di Personalizzazione del Corso

Per richiedere un training personalizzato per questo corso, contattateci per organizzarlo.

Ulteriori Informazioni...

Ottimizzazione delle Prestazioni della Rete Neurale con CANN SDK

14 ore

CANN SDK (Architettura di Calcolo per Neural Networks) è la base di calcolo AI di Huawei che consente ai developer di ottimizzare le prestazioni delle reti neurali distribuite sui processori AI Ascend.

Questo corso interattivo guidato da un instruttore (online o in sede) si rivolge a sviluppatori AI avanzati e ingegneri di sistema che desiderano ottimizzare le prestazioni dell'inferenza utilizzando il set di strumenti avanzato di CANN, incluso l'Engine del Grafo, TIK e lo sviluppo di operatori personalizzati.

Alla fine di questo corso, i partecipanti saranno in grado di:

Capire l'architettura di runtime e il ciclo vitale delle prestazioni di CANN.
Utilizzare strumenti di profilatura e Engine del Grafo per l'analisi e l'ottimizzazione delle prestazioni.
Crea ed ottimizza operatori personalizzati utilizzando TIK e TVM.
Risolvere i colloqui della memoria e migliorare il throughput del modello.

Formato del Corso

Lectura interattiva e discussione.
Laboratori pratici con profilatura in tempo reale e tuning degli operatori.
Esercizi di ottimizzazione utilizzando esempi di distribuzione su casi limite.

Opzioni di Personalizzazione del Corso

Per richiedere una formazione personalizzata per questo corso, contattateci per organizzare la vostra sessione.

Ulteriori Informazioni...

CANN SDK per Pipeline di Computer Vision e NLP

14 ore

Il CANN SDK (Compute Architecture for Neural Networks) fornisce potenti strumenti di distribuzione e ottimizzazione per applicazioni AI in tempo reale nella computer vision e nel NLP, specialmente su hardware Huawei Ascend.

Questo training guidato da un istruttore (online o in sede) è rivolto a professionisti dell'AI di livello intermedio che desiderano costruire, distribuire e ottimizzare modelli di visione e linguistica utilizzando il CANN SDK per scenari di produzione.

Al termine di questo training, i partecipanti saranno in grado di:

Distribuire e ottimizzare modelli CV e NLP utilizzando CANN e AscendCL.
Utilizzare gli strumenti CANN per convertire i modelli e integrarli nelle pipeline live.
Ottimizzare le prestazioni di inferenza per compiti come la rilevazione, la classificazione e l'analisi dei sentimenti.
Costruire pipeline CV/NLP in tempo reale per scenari di distribuzione sul bordo o basati su cloud.

Formato del Corso

Lezione interattiva e dimostrazione.
Laboratorio pratico con distribuzione di modelli e profilo delle prestazioni.
Design di pipeline live utilizzando casi d'uso reali di CV e NLP.

Opzioni di Personalizzazione del Corso

Per richiedere una formazione personalizzata per questo corso, contattateci per organizzare.

Ulteriori Informazioni...

Costruire Operatori AI Personalizzati con CANN TIK e TVM

14 ore

CANN TIK (Tensor Instruction Kernel) e Apache TVM abilitano ottimizzazioni avanzate e personalizzazioni degli operatori dei modelli AI per Huawei Ascend hardware.

Questo addestramento guidato dall'insegnante (online o sul posto di lavoro) è rivolto a sviluppatori di sistema di livello avanzato che desiderano creare, distribuire e ottimizzare operatori personalizzati per i modelli AI utilizzando il modello di programmazione TIK di CANN e l'integrazione del compilatore TVM.

Al termine di questo addestramento, i partecipanti saranno in grado di:

Scrivere e testare operatori AI personalizzati utilizzando il TIK DSL per i processori Ascend.
Integrare gli operatori personalizzati nell'ambiente runtime di CANN e nel grafo di esecuzione.
Utilizzare TVM per la pianificazione degli operatori, l'autotuning e il benchmarking.
Debuggare ed ottimizzare le prestazioni a livello istruzione per pattern di calcolo personalizzati.

Formato del Corso

Lezione interattiva e dimostrativa.
Sviluppo manuale degli operatori utilizzando le pipeline TIK e TVM.
Test e ottimizzazione su hardware Ascend o simulatori.

Opzioni di Personalizzazione del Corso

Per richiedere un addestramento personalizzato per questo corso, si prega di contattarci per organizzare.

Ulteriori Informazioni...

Migrando Applicazioni CUDA alle Architetture Cinesi GPU

21 ore

Le architetture cinesi GPU come Huawei Ascend, Biren e Cambricon MLU offrono alternative a CUDA adattate ai mercati locali di IA e HPC.

Questo corso interattivo guidato dal formatore (in linea o sul posto) è rivolto a programmatori esperti GPU e specialisti dell'infrastruttura che desiderano migrare ed ottimizzare le applicazioni CUDA esistenti per la distribuzione su piattaforme hardware cinesi.

Al termine del corso, i partecipanti saranno in grado di:

Valutare la compatibilità delle attuali cariche di lavoro CUDA con alternative basate su chip cinesi.
Migrare le basi di codice CUDA agli ambienti Huawei CANN, Biren SDK e Cambricon BANGPy.
Confrontare le prestazioni e identificare i punti di ottimizzazione tra piattaforme.
Risolvere sfide pratiche nel supporto interarchitetture e nella distribuzione.

Formato del Corso

Lettura interattiva ed esercitazione.
Esperimenti pratici di traduzione di codice e confronto delle prestazioni.
Esercizi guidati focalizzati su strategie di adattamento multi-GPU.

Opzioni per la Personalizzazione del Corso

Per richiedere un corso personalizzato basato sulla vostra piattaforma o progetto CUDA, contattateci per organizzare.

Ulteriori Informazioni...

Performance Optimization on Ascend, Biren, and Cambricon

21 ore

Ascend, Biren e Cambricon sono le principali piattaforme di hardware AI in Cina, ciascuna che offre strumenti unici di accelerazione e profilatura per carichi di lavoro AI a livello produttivo.

Questo training interattivo guidato dall'insegnante (online o sul posto) si rivolge agli ingegneri avanzati di infrastrutture AI e delle prestazioni che desiderano ottimizzare i flussi di lavoro per l'inferenza e il training dei modelli su diverse piattaforme di chip AI cinesi.

Al termine di questo corso, i partecipanti saranno in grado di:

Benchmarkare i modelli sulle piattaforme Ascend, Biren e Cambricon.
Identificare le bottlenecks del sistema e le inefficienze della memoria/calcolo.
Applicare ottimizzazioni a livello di grafico, kernel e operatore.
Tunare i pipeline di deploy per migliorare la throughput e la latenza.

Formato del Corso

Lecture interattiva e discussioni.
Uso pratica degli strumenti di profilatura ed ottimizzazione su ogni piattaforma.
Esercizi guidati focalizzati su scenari pratici di tuning.

Opzioni per la Personalizzazione del Corso

Per richiedere un training personalizzato basato sul vostro ambiente delle prestazioni o tipo di modello, contattateci per organizzare.

Ulteriori Informazioni...

Categorie relative

Corso di formazione Programmazione GPU con OpenACC

Struttura del corso

Requisiti

Corsi in Arrivo

Programmazione GPU con OpenACC

Programmazione GPU con OpenACC

Programmazione GPU con OpenACC

Programmazione GPU con OpenACC

Programmazione GPU con OpenACC

Categorie relative

Questo sito in altri paesi/regioni

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites