Informationssystem C: Data mining och data science

7,5 hp

Kursplan, Grundnivå, 2IS063

Kod
2IS063
Utbildningsnivå
Grundnivå
Huvudområde(n) med fördjupning
Informationssystem G2F
Betygsskala
Underkänd (U), godkänd (G), väl godkänd (VG)
Fastställd av
Institutionsstyrelsen, 27 februari 2020
Ansvarig institution
Institutionen för informatik och media

Allmänt

Kursen tillhör biområdet databasteknik.

Behörighetskrav

60 hp informationssystem eller motsvarande inklusive 7,5 hp databaser

Mål

Vad gäller kunskap och förståelse förväntas studenten efter genomgången kurs kunna

- förklara väsentliga begrepp inom områdena datalagring (data warehousing), big data analytics, datautvinning (data mining) och data science, samt hur dessa kan stödja beslutsfattande i organisationer,

- förklara hur datautvinning kan stödja arbetet med att besvara en forskningsfråga i ett data science projekt,

- beskriva och kategorisera olika datautvinningsmetoder samt förklara skillnaderna mellan dessa,

- förklara i vilka situationer en viss datautvinningsmetod kan användas för att besvara en given fråga.

Vad gäller färdigheter och förmåga förväntas studenten efter genomgången kurs kunna

- planera ett data science projekt som grundar sig på datautvinning, inklusive identifiering av problem, formulering av forskningsfrågor, val av data, förbehandlingsmetod(er), datautvinningsmetod(er) samt metod för evaluering av resultaten,

- använda elementära datautvinningsmetoder för att genomföra analyser.

Vad gäller värderingsförmåga och förhållningssätt förväntas studenten efter genomgången kurs kunna

- tolka och analysera resultaten av en datautvinningsprocess, samt värdera effekterna av val som har gjorts under processen,

- analysera och värdera de sociala följderna av datautvinning och big data i samhället med hänsyn till etiska aspekter.

Innehåll

Kursen introducerar studenten till datautvinning som metod för att besvara en forskningsfråga i en övergripande data science process. Data science processen är en vetenskapligt inriktad process som inbegriper problemidentifiering, frågeformulering, identifiering och förbehandling av data, val och tillämpning av analysmetod, samt analys och evaluering av resultaten. Under kursen diskuteras data ingående, bland annat olika datatyper och dataegenskaper, datatransformation, samt hur man kan behandla semi- eller ostrukturerade data, vilket ofta karaktäriserar big data. Vidare presenteras och tillämpas datautvinningsprocessen och de huvudsakliga datautvinningsoperationerna klassificering, klustring, associationsanalys och avvikelseanalys presenteras och metoder för dessa tillämpas. Särskilda ansatser för att bearbeta textdata, dvs för textutvinning, behandlas också. Dessutom diskuteras tillämpningsområden samt metodernas styrkor och svagheter. Till slut diskuteras också samhälleliga och etiska följder av datautvinning och big data analytics.

Undervisning

Föreläsningar, laborationer, seminarier.

Examination

Tentamen, inlämningsuppgifter, laborationer, seminarium.

Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare eller beslut om undantag som fattats av institutionens arbetsgrupp för studieärenden.

FÖLJ UPPSALA UNIVERSITET PÅ

facebook
instagram
twitter
youtube
linkedin