Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.        
        
        
            Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.        
    Struttura del corso
Introduzione all'AI Multi-Modale
- Che cos'è l'intelligenza artificiale multi-modale?
- Principali sfide e applicazioni
- Panoramica sui modelli multi-modal più avanzati
Elaborazione del Testo e Comprensione del Linguaggio Naturale
- Utilizzo dei LLM per gli agenti AI basati sul testo
- Comprendere l'ingegneria delle richieste per le attività multi-modal
- Afinamento dei modelli di testo per applicazioni specifiche del settore
Riconoscimento e Generazione di Immagini
- Elaborazione delle immagini con l'AI: classificazione, captioning e rilevamento degli oggetti
- Generazione di immagini con modelli di diffusione (Stable Diffusion, DALLE)
- Integrazione dei dati delle immagini con i modelli basati sul testo
Elaborazione del Linguaggio Parlato e dell'Auditivo
- Riconoscimento vocale con Whisper ASR
- Tecniche di sintesi testo-parola (TTS)
- Miglioramento delle interazioni utente con l'AI basata sulla voce
Integrazione degli Input Multi-Modali
- Costruzione di pipeline AI per il trattamento di diversi tipi di input
- Tecniche di fusione per combinare dati di testo, immagini e linguaggio parlato
- Applicazioni reali degli agenti AI multi-modal
Distribuzione degli Agenti AI Multi-Modali
- Costruire soluzioni di AI multi-modale guidate da API
- Ottimizzazione dei modelli per prestazioni e scalabilità
- Migliori pratica per la distribuzione dell'AI multi-modale in produzione
Considerazioni Etiche ed Evoluzioni Futuristiche
- Prevenire il bias e garantire l'imparzialità nell'IA multi-modale
- Preoccupazioni sulla privacy con i dati multi-modal
- Sviluppi futuri dell'intelligenza artificiale multi-modale
Riepilogo e Passaggi Successivi
Requisiti
- Comprendere i principi fondamentali dell'apprendimento automatico
- Esperienza con la programmazione in Python
- Familiarità con i framework di deep learning (ad esempio, TensorFlow, PyTorch)
Pubblico
- Sviluppatori AI
- Ricercatori
- Ingegneri multimedia
             21 Ore
        
        
Recensioni (1)
Formatore che risponde alle domande in tempo reale.
Adrian
Corso - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Traduzione automatica
 
                    