Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.
Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.
Struttura del corso
Introduzione al Fine-Tuning dei Modelli DeepSeek LLM
- Panoramica sui modelli DeepSeek, ad esempio DeepSeek-R1 e DeepSeek-V3
- Comprensione della necessità di fare il fine-tuning dei LLM
- Confronto tra il fine-tuning e l'ingegneria degli stimoli (prompt engineering)
Preparazione del Dataset per il Fine-Tuning
- Curazione di dataset specifici del dominio
- Tecniche di preprocessamento e pulizia dei dati
- Tokenizzazione e formattazione del dataset per il LLM DeepSeek
Configurazione dell'Ambiente per il Fine-Tuning
- Configurazione dell'accelerazione GPU e TPU
- Impostazione di Hugging Face Transformers con DeepSeek LLM
- Comprensione degli iperparametri per il fine-tuning
Fine-Tuning del Modello DeepSeek LLM
- Implementazione del fine-tuning supervisionato
- Utilizzo di LoRA (Low-Rank Adaptation) e PEFT (Parameter-Efficient Fine-Tuning)
- Esecuzione del fine-tuning distribuito per dataset a grande scala
Valutazione e Ottimizzazione dei Modelli Fine-Tuned
- Valutazione delle prestazioni del modello con metriche di valutazione
- Gestione dell'overfitting e dell'underfitting
- Ottimizzazione della velocità di inferenza ed efficienza del modello
Deployment dei Modelli Fine-Tuned DeepSeek
- Pacchettizzazione dei modelli per il deployment tramite API
- Integrazione di modelli fine-tuned in applicazioni
- Scalabilità del deployment con il cloud e il calcolo all'edge
Casistiche e Applicazioni nel Mondo Reale
- Modelli LLM fine-tuned per finanza, sanità e supporto al cliente
- Studi di caso su applicazioni industriali
- Considerazioni etiche nei modelli AI specifici del dominio
Sintesi e Prossimi Passaggi
Requisiti
- Esperienza con i framework di apprendimento automatico e di apprendimento profondo
- Familiarità con gli strumenti di traduzione (transformers) e grandi modelli linguistici (LLMs)
- Comprendere le tecniche di preprocessamento dei dati e dell'addestramento del modello
Pubblico
- Ricerche AI che esplorano il fine-tuning dei LLM
- Ingegneri di apprendimento automatico che sviluppano modelli AI personalizzati
- Sviluppatori avanzati che implementano soluzioni guidate dall'AI
21 Ore