Kursplan

Introduksjon til Large Language Models (LLMs)

  • Oversikt over LLM
  • Definisjon og betydning
  • Applikasjoner i AI i dag

Transformatorarkitektur

  • Hva er en transformator og hvordan fungerer den?
  • Hovedkomponenter og funksjoner
  • Innebygging og posisjonell koding
  • Multi-head oppmerksomhet
  • Feed-forward nevrale nettverk
  • Normalisering og restforbindelser

Transformatormodeller

  • Selvoppmerksomhet mekanisme
  • Enkoder-dekoder-arkitektur
  • Posisjonelle innstøpinger
  • BERT (Toveis koderepresentasjoner fra transformatorer)
  • GPT (Generative Pretrained Transformer)

Ytelsesoptimalisering og fallgruver

  • Kontekstlengde
  • Mamba og stat-rom-modeller
  • Flash oppmerksomhet
  • Sparsomme transformatorer
  • Synstransformatorer
  • Viktigheten av kvantisering

Forbedring av transformatorer

  • Gjenoppretting av utvidet tekstgenerering
  • Blanding av modeller
  • Tankenes tre

Finjustering

  • Teori om tilpasning i lav rang
  • Finjustering med QLora

Skaleringslover og optimalisering i LLM-er

  • Viktigheten av skaleringslover for LLM-er
  • Data- og modellstørrelseskalering
  • Beregningsmessig skalering
  • Parametereffektivitetsskalering

Optimalisering

  • Forholdet mellom modellstørrelse, datastørrelse, beregningsbudsjett og slutningskrav
  • Optimalisering av ytelse og effektivitet til LLM-er
  • Beste praksis og verktøy for opplæring og finjustering av LLM-er

Opplæring og finjustering av LLM-er

  • Trinn og utfordringer med å trene LLM-er fra bunnen av
  • Datainnsamling og vedlikehold
  • Krav til data, CPU og minne i stor skala
  • Optimaliseringsutfordringer
  • Landskap av åpen kildekode LLM-er

Grunnleggende om Reinforcement Learning (RL)

  • Introduksjon til Reinforcement Learning
  • Læring gjennom positiv forsterkning
  • Definisjon og kjernebegreper
  • Markov Decision Process (MDP)
  • Dynamisk programmering
  • Monte Carlo metoder
  • Tidsmessig forskjellslæring

Dyp Reinforcement Learning

  • Deep Q-Networks (DQN)
  • Proksimal policyoptimalisering (PPO)
  • Elements av Reinforcement Learning

Integrasjon av LLM og Reinforcement Learning

  • Kombinere LLM med Reinforcement Learning
  • Hvordan RL brukes i LLM-er
  • Reinforcement Learning med menneskelig tilbakemelding (RLHF)
  • Alternativer til RLHF

Kasusstudier og applikasjoner

  • Virkelige applikasjoner
  • Suksesshistorier og utfordringer

Avanserte emner

  • Avanserte teknikker
  • Avanserte optimaliseringsmetoder
  • Nyskapende forskning og utvikling

Sammendrag og neste trinn

Krav

  • Grunnleggende forståelse av Machine Learning

Publikum

  • Dataforskere
  • Programvareingeniører
 21 timer

Antall deltakere


Price per participant

Upcoming Courses

Related Categories