Form?l
L?re hvordan man bygger klassifiseringsmodeller i R, tolke dem, og hvordan modellevaluering kan styrkes med kryssvalidering.
Innhold
- Eksplorerende dataanalyse
- Bin?r klassifisering
- "Feature importance"
- Multiklasseklassifisering
- Kryssvalidering
- *ekstra (hvis nok tid)*
- "Hyperparameter tuning"
- PCA og/eller klyngeanalyse*
M?lgruppe
Prim?rt for humanister, men ogs? for forskere og studenter fra andre fagfelt som ?nsker ? f? mer innsikt i maskinl?ring. Kurset forutsetter at du har relativt god kjennskap til R. Grunnleggende kunnskaper i statistikk er ogs? en fordel, men ikke et krav for deltakelse.
Hvis du ikke deltok p? introkurset anbefales det ? se f?lgende videoer f?r kursoppstart
Varighet
2x3 timer
P?melding
Viktig: Deltakere m? ha med egen b?rbar PC eller Mac (laptop) med b?de R og RStudio ferdig installert. B?de R (≥ 3.3.0) og RStudio er gratis, s? det er ikke n?dvendig ? skaffe lisens. R kan lastes ned fra https://cran.r-project.org og RStudio fra https://www.rstudio.com/products/rstudio/download/.
Kurset holdes i et seminarrom, ikke en PC-stue. Det kan ogs? v?re greit ? ta med seg str?mledningen til egen datamaskin. Hvis behov for bistand til installering kontakt lokal-IT p? din enhet. Dersom du ikke har mulighet til ? installere R og RStudio p? egen maskin, kan du bruke UiO Programkiosk ("Statistikk fullskjerm").
Vennligst installér f?lgende pakker i R(studio)
MASS, xgboost, caret, pROC, patchwork, MLmetrics
*ekstra pakker* factoextra: Fremgangsm?te
Antall deltagere
20 (f?rst til m?lla)
Spr?k
Kurset holdes p? norsk
Kursleder
Luigi Maglanoc PhD, Gruppe for datafangst og samlingsforvaltning, USIT.
Kontaktinformasjon
Har du sp?rsm?l ang?ende kurset, kan du sende en epost statistikk@usit.uio.no
Annen informasjon
- Datasett
- R-kode