Kursplan

Introduksjon til Reinforcement Learning

  • Oversikt over forsterkende læring og dens anvendelser
  • Forskjeller mellom veiledet, uovervåket og forsterkende læring
  • Nøkkelbegreper: agent, miljø, belønninger og politikk

Markov-beslutningsprosesser (MDPs)

  • Forstå tilstander, handlinger, belønninger og tilstandsoverganger
  • Verdifunksjoner og Bellman-ligningen
  • Dynamisk programmering for å løse MDP-er

Kjerne RL-algoritmer

  • Tabellformede metoder: Q-Learning og SARSA
  • Policybaserte metoder: FORSTERK algoritme
  • Aktørkritiske rammeverk og deres anvendelser

Dyp Reinforcement Learning

  • Introduksjon til Deep Q-Networks (DQN)
  • Opplev replay og målnettverk
  • Policygradienter og avanserte dype RL-metoder

RL-rammer og verktøy

  • Introduksjon til OpenAI Gym og andre RL-miljøer
  • Bruker PyTorch eller TensorFlow for utvikling av RL-modeller
  • Trening, testing og benchmarking av RL-agenter

Utfordringer i RL

  • Balansering av leting og utnyttelse i trening
  • Håndtering av sparsomme belønninger og kredittoppgaveproblemer
  • Scalaevne og beregningsmessige utfordringer i RL

Hands-On Activities

  • Implementering av Q-Learning og SARSA-algoritmer fra bunnen av
  • Trene en DQN-basert agent til å spille et enkelt spill i OpenAI Gym
  • Finjustering av RL-modeller for forbedret ytelse i tilpassede miljøer

Sammendrag og neste trinn

Krav

  • Sterk forståelse av maskinlæringsprinsipper og algoritmer
  • Ferdighet i Python programmering
  • Kjennskap til nevrale nettverk og dype læringsrammer

Publikum

  • Maskinlæringsingeniører
  • AI-spesialister
 14 timer

Antall deltakere


Price per participant

Upcoming Courses

Related Categories