Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduksjon
- Læring gjennom positiv forsterkning
Elements av Reinforcement Learning
Viktige vilkår (handlinger, stater, belønninger, retningslinjer, verdi, Q-verdi osv.)
Oversikt over tabellløsningsmetoder
Opprette en programvareagent
Forstå verdibaserte, policybaserte og modellbaserte tilnærminger
Arbeide med Markov Decision Process (MDP)
Hvordan retningslinjer definerer en agents måte å oppføre seg på
Bruke Monte Carlo-metoder
Temporal-Difference Learning
n-trinn Bootstrapping
Omtrentlig løsningsmetoder
Forutsigelse i henhold til retningslinjer med tilnærming
On-policy kontroll med tilnærming
Off-policy Metoder med tilnærming
Forstå kvalifikasjonsspor
Bruke policygradientmetoder
Oppsummering og konklusjon
Krav
- Erfaring med maskinlæring
- Programming erfaring
Publikum
- Dataforskere
21 timer