12 praksisbaserede lektionerI dette modul vil eleverne blive placeret i rollen som en rigtig
dataforsker, der har til opgave at løse et problem. De vil følge instruktørens vejledning og gennemgår de trin, en dataforsker har taget - fra indhentning af data og beskrivelse af problemet til løsning af det.
Denne disciplin, også kendt som datavidenskab, er en af de grene af datalogi, der har blomstret i det sidste årti og fungerer som grundlaget for mange af de muligheder, som internettet tilbyder i dag. Det er tæt forbundet med populære begreber som
kunstig intelligens, maskinlæring, big data, forudsigelser, deep learning og meget mere. Det er et felt, hvor store virksomheder som Google, Facebook, Amazon, Apple, IBM, Microsoft og andre investerer betydelige beløb.
Efter at have gennemført modulet vil eleverne
have kendskab til:
- Forskellige metoder til datastrukturering.
- Forskellige typer data og deres fordele og ulemper.
- Hvordan man udforsker et datasæt og overvejer relevante kriterier.
- Simple forudsigelsesalgoritmer (beslutningstræ, Random Forest, SVM, KNN).
- Begrebet statistik til fortolkning af resultater.
- Simple klynge/gruppering algoritmer (K-Means, DBScan) med deres fordele og ulemper.
- Måder at præsentere resultater og grundlæggende typer grafer på.
Bløde færdigheder: At arbejde med information, håndtere opmærksomhed og forstå ens rolle i et teamwork-miljø.