Struttura del corso

Introduzione a Reinforcement Learning

  • Che cos'è l'apprendimento per rinforzo?
  • Concetti chiave: agente, ambiente, stati, azioni e ricompense
  • Sfide nell'apprendimento per rinforzo

Esplorazione e sfruttamento

  • Bilanciare esplorazione e sfruttamento nei modelli RL
  • Strategie di esplorazione: epsilon-greedy, softmax e altro ancora

Q-Learning e Deep Q-Networks (DQN)

  • Introduzione al Q-learning
  • Implementazione di DQN utilizzando TensorFlow
  • Ottimizzazione del Q-learning con il replay dell'esperienza e le reti target

Metodi basati su criteri

  • Algoritmi di gradiente dei criteri
  • L'algoritmo REINFORCE e la sua implementazione
  • Metodi attore-critico

Lavorare con OpenAI Gym

  • Configurazione degli ambienti in OpenAI Palestra
  • Simulazione di agenti in ambienti dinamici
  • Valutazione delle prestazioni degli agenti

Tecniche avanzate Reinforcement Learning

  • Apprendimento per rinforzo multi-agente
  • Gradiente di politica deterministica profonda (DDPG)
  • Ottimizzazione dei criteri prossimali (PPO)

Distribuzione di modelli Reinforcement Learning

  • Applicazioni reali dell'apprendimento per rinforzo
  • Integrazione dei modelli RL negli ambienti di produzione

Riepilogo e passaggi successivi

Requisiti

  • Esperienza con la programmazione Python
  • Comprensione di base dei concetti di deep learning e machine learning
  • Conoscenza degli algoritmi e dei concetti matematici utilizzati nell'apprendimento per rinforzo

Pubblico

  • Scienziati dei dati
  • Professionisti dell'apprendimento automatico
  • Ricercatori di intelligenza artificiale
 28 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (4)

Corsi in Arrivo

Categorie relative