Corso di formazione Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi è un corso pratico dedicato alla messa in servizio affidabile e scalabile dei modelli Tencent Hunyuan.

Questa formazione guidata da un istruttore, erogata in modalità live (online o in sede), è rivolta a ingegneri e architetti di livello intermedio che desiderano utilizzare Tencent Hunyuan per distribuire modelli di grandi dimensioni e modelli MoE (Mixture of Experts), ottenendo una latenza ridotta, un utilizzo migliore della GPU e un controllo dei costi operativi.

Al termine di questa formazione, i partecipanti saranno in grado di:

spiegare le principali sfide operative legate all'uso in produzione dei modelli Tencent Hunyuan.
applicare tecniche pratiche di ottimizzazione dell'inferenza, come TensorRT, regolazione della KV-cache, quantizzazione e batching.
progettare strategie di distribuzione scalabili con autoscaling, monitoraggio e pianificazione della capacità.
ottimizzare il compromesso tra latenza e costi per carichi di lavoro reali in produzione.

Formato del Corso

Lezioni interattive e discussioni.
Numerosi esercizi e sessioni pratiche.
Implementazione pratica in un ambiente di laboratorio live.

Opzioni di Personalizzazione del Corso

Per richiedere una formazione personalizzata per questo corso, contattateci per organizzare la sessione.

Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.

Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.

Corsi in Arrivo

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

2026-05-18 09:30

14 ore

Genova

2100 EUR (Online)

2500 EUR (Classe)

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

2026-06-01 09:30

14 ore

Bologna

2100 EUR (Online)

2500 EUR (Classe)

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

2026-06-15 09:30

14 ore

Roma

2100 EUR (Online)

2500 EUR (Classe)

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

2026-06-29 09:30

14 ore

Milano

2100 EUR (Online)

2500 EUR (Classe)

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

2026-07-13 09:30

14 ore

Napoli

2100 EUR (Online)

2500 EUR (Classe)

Corso di formazione Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Struttura del corso

Requisiti

Corsi in Arrivo

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Categorie relative

Questo sito in altri paesi/regioni

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Corso di formazione Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Struttura del corso

Requisiti

Corsi in Arrivo

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Distribuire Tencent Hunyuan in Produzione: Inferenza a Bassa Latenza e Ottimizzazione dei Costi

Corsi relativi

Avanzato LangGraph: Ottimizzazione, Debugging e Monitoraggio di Grafi Complessi

Creare Agenti di Codifica con Devstral: Dalla Progettazione degli Agenti allo Strumentamento

Open-Source Model Ops: Self-Hosting, Fine-Tuning e Governance con Modelli Devstral & Mistral

Applicazioni di LangGraph nel settore finanziario

Fondamenti di LangGraph: Promozione e Catena basate su Grafi

LangGraph nella Salute: Orchestrazione dei Flussi di Lavoro per Ambienti Regolamentati

LangGraph per Applicazioni Legali

Creazione di Flussi di Lavoro Dinamici con LangGraph e Agenti LLM

LangGraph per l'Automazione del Marketing

Le Chat Enterprise: ChatOps Privato, Integrazioni & Controlli di Amministrazione

Cost-Effective LLM Architectures: Mistral at Scale (Performance / Cost Engineering)

Productizing Conversational Assistants with Mistral Connectors & Integrations

Enterprise-Grade Deployments with Mistral Medium 3

Mistral per l'AI Responsabile: Privacy, Residenza dei Dati e Controlli Aziendali

Applicazioni Multimodali con Modelli Mistral (Visione, OCR e Comprensione Documentale)

Categorie relative

Large Language Models (LLMs)

Questo sito in altri paesi/regioni

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites