Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Struttura del corso
Introduzione all'AI Multi-Modale
- Che cos'è l'intelligenza artificiale multi-modale?
- Principali sfide e applicazioni
- Panoramica sui modelli multi-modal più avanzati
Elaborazione del Testo e Comprensione del Linguaggio Naturale
- Utilizzo dei LLM per gli agenti AI basati sul testo
- Comprendere l'ingegneria delle richieste per le attività multi-modal
- Afinamento dei modelli di testo per applicazioni specifiche del settore
Riconoscimento e Generazione di Immagini
- Elaborazione delle immagini con l'AI: classificazione, captioning e rilevamento degli oggetti
- Generazione di immagini con modelli di diffusione (Stable Diffusion, DALLE)
- Integrazione dei dati delle immagini con i modelli basati sul testo
Elaborazione del Linguaggio Parlato e dell'Auditivo
- Riconoscimento vocale con Whisper ASR
- Tecniche di sintesi testo-parola (TTS)
- Miglioramento delle interazioni utente con l'AI basata sulla voce
Integrazione degli Input Multi-Modali
- Costruzione di pipeline AI per il trattamento di diversi tipi di input
- Tecniche di fusione per combinare dati di testo, immagini e linguaggio parlato
- Applicazioni reali degli agenti AI multi-modal
Distribuzione degli Agenti AI Multi-Modali
- Costruire soluzioni di AI multi-modale guidate da API
- Ottimizzazione dei modelli per prestazioni e scalabilità
- Migliori pratica per la distribuzione dell'AI multi-modale in produzione
Considerazioni Etiche ed Evoluzioni Futuristiche
- Prevenire il bias e garantire l'imparzialità nell'IA multi-modale
- Preoccupazioni sulla privacy con i dati multi-modal
- Sviluppi futuri dell'intelligenza artificiale multi-modale
Riepilogo e Passaggi Successivi
Requisiti
- Comprendere i principi fondamentali dell'apprendimento automatico
- Esperienza con la programmazione in Python
- Familiarità con i framework di deep learning (ad esempio, TensorFlow, PyTorch)
Pubblico
- Sviluppatori AI
- Ricercatori
- Ingegneri multimedia
21 ore
Recensioni (1)
Formatore che risponde alle domande in tempo reale.
Adrian
Corso - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Traduzione automatica