Data engineering II

10 hp

Kursplan, Avancerad nivå, 1TD076

Kod
1TD076
Utbildningsnivå
Avancerad nivå
Huvudområde(n) med fördjupning
Dataanalys A1F, Datavetenskap A1F, Teknik A1F, Tillämpad beräkningsvetenskap A1F
Betygsskala
Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
Fastställd av
Teknisk-naturvetenskapliga fakultetsnämnden, 29 februari 2024
Ansvarig institution
Institutionen för informationsteknologi

Allmänt

Syftet med den här kursen är att ge de avancerade kunskaper i applikationskontextualisering, skalbar analys av strömmande data, förståelse för de processer och teknologier som krävs för storskalig distribuerad maskininlärning, samt färdighet i att bygga upp och automatisera pipelines och workflows som täcker hela kedjan från data till maskininlärningsmodeller i produktion.

Behörighetskrav

120 hp. Genomgången Data engineering I. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)

Mål

Efter godkänd kurs ska studenten kunna

  • redogöra för användningen av virtualisering på OS-nivå (containrar) och arbeta med applikationskontextualisering;
  • beskriva styrkor och svagheter hos, samt praktiskt använda, moderna system för hantering av strömmande data;
  • analysera egenskaper hos dataintensiva tillämpningar med strömmande data och använda analysen till att föreslå lämpliga arkitekturer för att hantera tillämpningen inklusive kombination av strömmande data och batchanalys;
  • implementera programvara där analysen från föregående punkt och teknik som presenteras i kursen används;
  • redogöra för och hantera praktiska aspekter av produktionssättning av maskininlärningsmodeller;
  • använda sig av ramverk för storskalig distribuerad maskininlärning;
  • kritiskt analysera, diskutera och presentera lösningar och implementationer skriftligt och muntligt.

Innehåll

Avancerade koncept i molnberäkningar såsom orkestrering av programbehållare (containers) och automatisering. Teori och ramverk för skalbar hantering och analys av dataströmmar såsom Apache Pulsar. Driftsättning och användande av ramverk för distribuerad maskininlärning. Mjukvara och system för konstruktion av molnnativa workflows för kontinuerlig modellering, övervakning och produktionssättning av modeller. Livscykelhantering av maskininlärningsmodeller.

Undervisning

Föreläsningar, laborationer, seminarier och grupphandledning.

Examination

Skriftlig rapport och aktivt deltagande i litteraturseminarier (1 hp). Skriftliga rapporter för inlämningsuppgifterna (5 hp), samt muntlig och skriftlig rapport för programvaruprojektet (4 hp).

Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.

Övriga föreskrifter

Kursen kan inte ingå i samma examen som 1TD075.

FÖLJ UPPSALA UNIVERSITET PÅ

facebook
instagram
twitter
youtube
linkedin