Struttura del corso

Fondamenti dei Sistemi Agentici in Produzione

  • Architetture agentiche: cicli, strumenti, memoria e livelli di orchestrazione
  • Ciclo di vita degli agenti: sviluppo, deployment e operazioni continue
  • Sfide della gestione degli agenti su larga scala

Infrastruttura e Modelli di Deployment

  • Deploy degli agenti in ambienti containerizzati e cloud
  • Pattern di scalabilità: scaling orizzontale vs verticale, concorrenza e throttling
  • Orchestrazione multi-agente e bilanciamento del carico

Monitoraggio e Osservabilità

  • Metriche chiave: latenza, tasso di successo, utilizzo della memoria e profondità delle chiamate degli agenti
  • Tracciamento dell'attività agente e dei grafi delle chiamate
  • Strumentazione di osservabilità utilizzando Prometheus, OpenTelemetry e Grafana

Logging, Auditing e Compliance

  • Logging centralizzato e raccolta di eventi strutturati
  • Compliance e auditabilità nei workflow agente
  • Progettazione di tracce di audit e meccanismi di riproduzione per il debug

Ottimizzazione delle Prestazioni e delle Risorse

  • Riduzione dell'overhead di inferenza e ottimizzazione dei cicli di orchestrazione degli agenti
  • Caching del modello e incorporamenti leggeri per una rapida recupero
  • Test di carico e scenari stress per pipeline AI

Controllo dei Costi e Governance

  • Comprensione dei driver di costi degli agenti: chiamate API, memoria, calcolo e integrazioni esterne
  • Tracciamento dei costi a livello agente e implementazione di modelli di chargeback
  • Politiche di automazione per prevenire lo spread degli agenti e il consumo di risorse inattive

Strategie CI/CD e Rollout per gli Agenti

  • Integrazione delle pipeline agente nei sistemi CI/CD
  • Testing, versioning e strategie di rollback per aggiornamenti iterativi degli agenti
  • Rollout progressivi e meccanismi di deployment sicuro

Recupero da Fallimenti e Ingegneria della Affidabilità

  • Progettazione per tolleranza ai guasti e degrado graceful
  • Pattern di retry, timeout e circuit breaker per l'affidabilità degli agenti
  • Risposta agli incidenti e framework post-mortem per le operazioni AI

Progetto Culminante

  • Costruire e deploy un sistema AI agente con monitoraggio completo e tracciamento dei costi
  • Simulare il carico, misurare le prestazioni e ottimizzare l'uso delle risorse
  • Presentare l'architettura finale e il dashboard di monitoraggio ai colleghi

Riepilogo e Passi Successivi

Requisiti

  • Solida comprensione di MLOps e sistemi machine learning produttivi
  • Esperienza con deployment containerizzati (Docker/Kubernetes)
  • Familiarità con strumenti di ottimizzazione dei costi e osservabilità cloud

Pubblico Target

  • Ingegneri MLOps
  • Ingegneri di Affidabilità del Sito (SREs)
  • Manager tecnici che supervisionano l'infrastruttura AI
 21 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (3)

Corsi in Arrivo

Categorie relative