Kursplan

Introduksjon

  • Læring gjennom positiv forsterkning

Elements av Reinforcement Learning

Viktige vilkår (handlinger, stater, belønninger, retningslinjer, verdi, Q-verdi osv.)

Oversikt over tabellløsningsmetoder

Opprette en programvareagent

Forstå verdibaserte, policybaserte og modellbaserte tilnærminger

Arbeide med Markov Decision Process (MDP)

Hvordan retningslinjer definerer en agents måte å oppføre seg på

Bruke Monte Carlo-metoder

Temporal-Difference Learning

n-trinn Bootstrapping

Omtrentlig løsningsmetoder

Forutsigelse i henhold til retningslinjer med tilnærming

On-policy kontroll med tilnærming

Off-policy Metoder med tilnærming

Forstå kvalifikasjonsspor

Bruke policygradientmetoder

Oppsummering og konklusjon

Krav

  • Erfaring med maskinlæring
  • Programming erfaring

Publikum

  • Dataforskere
 21 timer

Antall deltakere


Price per participant

Upcoming Courses

Related Categories