Kursplan

Introduksjon til Reinforcement Learning

  • Hva er forsterkende læring?
  • Nøkkelbegreper: agent, miljø, stater, handlinger og belønninger
  • Utfordringer i forsterkende læring

Utforskning og utnyttelse

  • Balansering av leting og utnyttelse i RL-modeller
  • Utforskningsstrategier: epsilon-grådig, softmax og mer

Q-Learning og Deep Q-Networks (DQN)

  • Introduksjon til Q-læring
  • Implementering av DQN-er ved å bruke TensorFlow
  • Optimalisering av Q-læring med erfaringsreplay og målnettverk

Policybaserte metoder

  • Policygradientalgoritmer
  • FORSTERK algoritmen og dens implementering
  • Skuespiller-kritiske metoder

Jobber med OpenAI Gym

  • Sette opp miljøer i OpenAI Gym
  • Simulering av agenter i dynamiske miljøer
  • Evaluering av agentytelse

Avanserte Reinforcement Learning teknikker

  • Multi-agent forsterkende læring
  • Deep deterministic policy gradient (DDPG)
  • Proksimal policyoptimalisering (PPO)

Utplassering av Reinforcement Learning modeller

  • Virkelige anvendelser av forsterkende læring
  • Integrering av RL-modeller i produksjonsmiljøer

Sammendrag og neste trinn

Krav

  • Erfaring med Python programmering
  • Grunnleggende forståelse av dyp læring og maskinlæringskonsepter
  • Kunnskap om algoritmer og matematiske begreper brukt i forsterkningslæring

Publikum

  • Dataforskere
  • Utøvere av maskinlæring
  • AI-forskere
 28 timer

Antall deltakere


Price per participant

Testimonials (4)

Upcoming Courses

Related Categories