Struttura del corso

Introduzione all'apprendimento per rinforzo

  • Panoramica sull'apprendimento per rinforzo e le sue applicazioni
  • Differenze tra apprendimento supervisionato, non supervisionato e per rinforzo
  • Concetti chiave: agente, ambiente, ricompense e politica

Processi Decisionali di Markov (MDPs)

  • Comprensione degli stati, delle azioni, delle ricompense e delle transizioni di stato
  • Funzioni di valore e l'equazione di Bellman
  • Programmazione dinamica per la soluzione dei MDPs

Algoritmi fondamentali di RL

  • Metodi tabulari: Q-Learning e SARSA
  • Metodi basati sulla politica: algoritmo REINFORCE
  • Frammenti Actor-Critic e le loro applicazioni

Apprendimento per rinforzo profondo

  • Introduzione alle Deep Q-Networks (DQN)
  • Riproduzione dell'esperienza e reti target
  • Gradiente di politica e metodi avanzati di RL profondo

Framework e strumenti per l'RL

  • Introduzione a OpenAI Gym ed altri ambienti RL
  • Utilizzo di PyTorch o TensorFlow per lo sviluppo di modelli RL
  • Addestramento, test e benchmarking degli agenti RL

Sfide nell'RL

  • Bilanciare esplorazione ed esplotazione durante l'addestramento
  • Gestire ricompense sparse e problemi di assegnazione del credito
  • Scalabilità e sfide computazionali nell'RL

Attività pratiche

  • Implementazione degli algoritmi Q-Learning e SARSA da zero
  • Addestramento di un agente basato su DQN per giocare a un gioco semplice in OpenAI Gym
  • Ottimizzazione dei modelli RL per una prestazione migliore in ambienti personalizzati

Riepilogo e prossimi passi

Requisiti

  • Comprensione solida dei principi e degli algoritmi dell'apprendimento automatico
  • Abilità nella programmazione Python
  • Familiarità con i neuroni e i framework di deep learning

Pubblico

  • Ingegneri dell'apprendimento automatico
  • Specialisti in intelligenza artificiale
 14 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (1)

Corsi in Arrivo

Categorie relative