Förstärkningsinlärning
Kursplan, Avancerad nivå, 1RT745
- Kod
- 1RT745
- Utbildningsnivå
- Avancerad nivå
- Huvudområde(n) med fördjupning
- Inbyggda system A1N, Teknik A1N
- Betygsskala
- Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
- Fastställd av
- Teknisk-naturvetenskapliga fakultetsnämnden, 25 januari 2022
- Ansvarig institution
- Institutionen för informationsteknologi
Behörighetskrav
120 hp inklusive Sannolikhet och statistik, Linjär Algebra II, Envariabelanalys, Programmeringsteknik II, Reglerteknik I. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)
Mål
Efter godkänd kurs ska studenten kunna:
- förklara möjligheter och begränsningar inom förstärkningsinlärning,
- analysera relevanta tillämpningar, avgöra om de kan formuleras som förstärkningsinlärningsproblem, och i så fall formellt ta fram en sådan formulering,
- implementera, använda och utvärdera centrala algoritmer för förstärkningsinlärning.
Innehåll
Kursen ger en grundlig introduktion till moderna verktyg för att ta fram, implementera och analysera algoritmer för förstärkningsinlärning. Kursen går igenom Markov-beslutsprocesser, planering via dynamisk programmering, modellfri prediktion och styrning, avvägning mellan prospektering och exploatering, funktionsapproximationer och policy-gradientmetoder, och berör även djup förstärkningsinlärning. Bland de tillämpningar som diskuteras under kursen finns klassiska reglerproblem som den inverterade pendeln, men även robotik och datorspel.
Undervisning
Föreläsningar, seminarier, datorlaborationer.
Examination
Kursen examineras kontinuerligt genom muntlig och skriftlig redovisning av uppgifter (2 hp) samt genom skriftligt prov (3 hp).
Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.
Övriga föreskrifter
Kursen kan ej ingå i examen tillsammans med 1RT747 Förstärkningsinlärning.