Struttura del corso

Introduzione all'AI Multi-Modale

  • Che cos'è l'intelligenza artificiale multi-modale?
  • Principali sfide e applicazioni
  • Panoramica sui modelli multi-modal più avanzati

Elaborazione del Testo e Comprensione del Linguaggio Naturale

  • Utilizzo dei LLM per gli agenti AI basati sul testo
  • Comprendere l'ingegneria delle richieste per le attività multi-modal
  • Afinamento dei modelli di testo per applicazioni specifiche del settore

Riconoscimento e Generazione di Immagini

  • Elaborazione delle immagini con l'AI: classificazione, captioning e rilevamento degli oggetti
  • Generazione di immagini con modelli di diffusione (Stable Diffusion, DALLE)
  • Integrazione dei dati delle immagini con i modelli basati sul testo

Elaborazione del Linguaggio Parlato e dell'Auditivo

  • Riconoscimento vocale con Whisper ASR
  • Tecniche di sintesi testo-parola (TTS)
  • Miglioramento delle interazioni utente con l'AI basata sulla voce

Integrazione degli Input Multi-Modali

  • Costruzione di pipeline AI per il trattamento di diversi tipi di input
  • Tecniche di fusione per combinare dati di testo, immagini e linguaggio parlato
  • Applicazioni reali degli agenti AI multi-modal

Distribuzione degli Agenti AI Multi-Modali

  • Costruire soluzioni di AI multi-modale guidate da API
  • Ottimizzazione dei modelli per prestazioni e scalabilità
  • Migliori pratica per la distribuzione dell'AI multi-modale in produzione

Considerazioni Etiche ed Evoluzioni Futuristiche

  • Prevenire il bias e garantire l'imparzialità nell'IA multi-modale
  • Preoccupazioni sulla privacy con i dati multi-modal
  • Sviluppi futuri dell'intelligenza artificiale multi-modale

Riepilogo e Passaggi Successivi

Requisiti

  • Comprendere i principi fondamentali dell'apprendimento automatico
  • Esperienza con la programmazione in Python
  • Familiarità con i framework di deep learning (ad esempio, TensorFlow, PyTorch)

Pubblico

  • Sviluppatori AI
  • Ricercatori
  • Ingegneri multimedia
 21 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (1)

Corsi in Arrivo

Categorie relative