Struttura del corso

Introduzione

  • Apprendimento attraverso il rinforzo positivo

Elementi di Reinforcement Learning

Termini importanti (Azioni, Stati, Ricompense, Politica, Valore, Q-Value, ecc.)

Cenni preliminari sui metodi delle soluzioni tabulari

Creazione di un agente software

Comprendere gli approcci basati sul valore, sui criteri e sui modelli

Lavorare con il processo decisionale di Markov (MDP)

In che modo le policy definiscono il modo di comportarsi di un agente

Utilizzo dei metodi Monte Carlo

Apprendimento per differenza temporale

n-step Bootstrapping

Metodi di soluzione approssimati

Previsione in base alle policy con approssimazione

Controllo su policy con approssimazione

Metodi off-policy con approssimazione

Informazioni sulle tracce di idoneità

Utilizzo dei metodi del gradiente dei criteri

Riassunto e conclusione

Requisiti

  • Esperienza con l'apprendimento automatico
  • Programming Esperienza

Pubblico

  • Scienziati dei dati
  21 ore
 

Numero di Partecipanti


Data Inizio

Data Fine


Le date sono soggette a disponibilità e si svolgono tra le 09:30 e le 16:30.
I corsi di formazione pubblici richiedono più di 5 partecipanti.

Corsi relativi

AI and Robotics for Nuclear - Extended

  120 ore

AI and Robotics for Nuclear

  80 ore

Categorie relative