Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduksjon til Large Language Models (LLMs)
- Oversikt over LLM
- Definisjon og betydning
- Applikasjoner i AI i dag
Transformatorarkitektur
- Hva er en transformator og hvordan fungerer den?
- Hovedkomponenter og funksjoner
- Innebygging og posisjonell koding
- Multi-head oppmerksomhet
- Feed-forward nevrale nettverk
- Normalisering og restforbindelser
Transformatormodeller
- Selvoppmerksomhet mekanisme
- Enkoder-dekoder-arkitektur
- Posisjonelle innstøpinger
- BERT (Toveis koderepresentasjoner fra transformatorer)
- GPT (Generative Pretrained Transformer)
Ytelsesoptimalisering og fallgruver
- Kontekstlengde
- Mamba og stat-rom-modeller
- Flash oppmerksomhet
- Sparsomme transformatorer
- Synstransformatorer
- Viktigheten av kvantisering
Forbedring av transformatorer
- Gjenoppretting av utvidet tekstgenerering
- Blanding av modeller
- Tankenes tre
Finjustering
- Teori om tilpasning i lav rang
- Finjustering med QLora
Skaleringslover og optimalisering i LLM-er
- Viktigheten av skaleringslover for LLM-er
- Data- og modellstørrelseskalering
- Beregningsmessig skalering
- Parametereffektivitetsskalering
Optimalisering
- Forholdet mellom modellstørrelse, datastørrelse, beregningsbudsjett og slutningskrav
- Optimalisering av ytelse og effektivitet til LLM-er
- Beste praksis og verktøy for opplæring og finjustering av LLM-er
Opplæring og finjustering av LLM-er
- Trinn og utfordringer med å trene LLM-er fra bunnen av
- Datainnsamling og vedlikehold
- Krav til data, CPU og minne i stor skala
- Optimaliseringsutfordringer
- Landskap av åpen kildekode LLM-er
Grunnleggende om Reinforcement Learning (RL)
- Introduksjon til Reinforcement Learning
- Læring gjennom positiv forsterkning
- Definisjon og kjernebegreper
- Markov Decision Process (MDP)
- Dynamisk programmering
- Monte Carlo metoder
- Tidsmessig forskjellslæring
Dyp Reinforcement Learning
- Deep Q-Networks (DQN)
- Proksimal policyoptimalisering (PPO)
- Elements av Reinforcement Learning
Integrasjon av LLM og Reinforcement Learning
- Kombinere LLM med Reinforcement Learning
- Hvordan RL brukes i LLM-er
- Reinforcement Learning med menneskelig tilbakemelding (RLHF)
- Alternativer til RLHF
Kasusstudier og applikasjoner
- Virkelige applikasjoner
- Suksesshistorier og utfordringer
Avanserte emner
- Avanserte teknikker
- Avanserte optimaliseringsmetoder
- Nyskapende forskning og utvikling
Sammendrag og neste trinn
Krav
- Grunnleggende forståelse av Machine Learning
Publikum
- Dataforskere
- Programvareingeniører
21 timer