Struttura del corso

Introduzione

  • Cosa sono Large Language Models (LLMs)?
  • LLM vs modelli NLP tradizionali
  • Panoramica delle caratteristiche e dell'architettura degli LLM
  • Sfide e limiti degli LLM

Comprendere gli LLM

  • Il ciclo di vita di un LLM
  • Come funzionano gli LLM
  • I componenti principali di un LLM: encoder, decoder, attenzione, embedding, ecc.

Introduttiva

  • Impostazione dell'ambiente di sviluppo
  • Installazione di un LLM come strumento di sviluppo, ad esempio Google Colab, Hugging Face

Lavorare con gli LLM

  • Esplorare le opzioni LLM disponibili
  • Creazione e utilizzo di un LLM
  • Messa a punto di un LLM su un set di dati personalizzato

Riassunto del testo

  • Comprendere il compito di riassunto del testo e le sue applicazioni
  • Utilizzo di un LLM per il riassunto di testi estrattivi e astratti
  • Valutare la qualità dei riepiloghi generati utilizzando metriche come ROUGE, BLEU, ecc.

Risposta alle domande

  • Comprendere il compito di rispondere alle domande e le sue applicazioni
  • Utilizzo di un LLM per la risposta a domande a dominio aperto e a dominio chiuso
  • Valutare l'accuratezza delle risposte generate utilizzando metriche come F1, EM, ecc.

Generazione di testo

  • Comprendere l'attività di generazione del testo e le sue applicazioni
  • Utilizzo di un LLM per la generazione di testo condizionale e incondizionato
  • Controllo dello stile, del tono e del contenuto dei testi generati utilizzando parametri come temperatura, top-k, top-p, ecc.

Integrazione degli LLM con altri framework e piattaforme

  • Utilizzo di LLM con PyTorch o TensorFlow
  • Utilizzo di LLM con Flask o Streamlit
  • Utilizzo di LLM con Google Cloud o AWS

Risoluzione dei problemi

  • Comprendere gli errori e i bug più comuni negli LLM
  • Utilizzo di TensorBoard per monitorare e visualizzare il processo di formazione
  • Utilizzo di PyTorch Lightning per semplificare il codice di addestramento e migliorare le prestazioni
  • Utilizzo di Hugging Face Datasets per caricare e pre-elaborare i dati

Riepilogo e prossime tappe

Requisiti

    Comprensione dell'elaborazione del linguaggio naturale e del deep learning Esperienza con Python e PyTorch o TensorFlow Esperienza di programmazione di base

Pubblico

    Gli sviluppatori Appassionati di PNL Scienziati dei dati
 14 ore

Numero di Partecipanti



Prezzo per Partecipante

Corsi relativi

Categorie relative