Struttura del corso

Introduzione

  • Cosa sono Large Language Models (LLMs)?
  • LLM vs modelli NLP tradizionali
  • Panoramica delle caratteristiche e dell'architettura degli LLM
  • Sfide e limiti degli LLM

Capire gli LLM

  • Il ciclo di vita di un LLM
  • Come funzionano gli LLM
  • I componenti principali di un LLM: encoder, decoder, attenzione, embedding, ecc.

Introduttiva

  • Impostazione dell'ambiente di sviluppo
  • Installazione di un LLM come strumento di sviluppo, ad esempio Google Colab, Hugging Face

Lavorare con gli LLM

  • Esplorazione delle opzioni LLM disponibili
  • Creazione e utilizzo di un LLM
  • Ottimizzazione di un LLM su un set di dati personalizzato

Riassunto del testo

  • Comprendere il compito del riassunto del testo e le sue applicazioni
  • Utilizzo di un LLM per il riassunto estrattivo e astratto del testo
  • Valutazione della qualità dei riepiloghi generati utilizzando metriche come ROUGE, BLEU, ecc.

Risposta alle domande

  • Comprendere il compito della risposta alle domande e le sue applicazioni
  • Utilizzo di un LLM per la risposta alle domande a dominio aperto e chiuso
  • Valutazione dell'accuratezza delle risposte generate utilizzando metriche come F1, EM, ecc.

Generazione di testo

  • Comprendere il compito della generazione di testo e le sue applicazioni
  • Utilizzo di un LLM per la generazione di testo condizionale e incondizionato
  • Controllo dello stile, del tono e del contenuto dei testi generati utilizzando parametri come temperatura, top-k, top-p, ecc.

Integrazione degli LLM con altri framework e piattaforme

  • Utilizzo di LLM con PyTorch o TensorFlow
  • Utilizzo di LLM con Flask o Streamlit
  • Utilizzo di LLM con Google Cloud o AWS

Risoluzione dei problemi

  • Comprendere gli errori e i bug comuni negli LLM
  • Utilizzo di TensorBoard per monitorare e visualizzare il processo di formazione
  • Utilizzo di PyTorch Lightning per semplificare il codice di addestramento e migliorare le prestazioni
  • Utilizzo di Hugging Face set di dati per caricare e pre-elaborare i dati

Riepilogo e passaggi successivi

Requisiti

  • Comprensione dell'elaborazione del linguaggio naturale e del deep learning
  • Esperienza con Python e PyTorch o TensorFlow
  • Esperienza di programmazione di base

Pubblico

  • Gli sviluppatori
  • Appassionati di PNL
  • Scienziati dei dati
 14 ore

Numero di Partecipanti


Prezzo per Partecipante

Corsi in Arrivo

Categorie relative