Del 1

Vi skal lage et lite datasett som inneholder data for fire personer, som angir deres respons til en behandling. 

Oppgave 1

Lag en variabel som inneholder tallene 1-4 i stigende rekkef?lge, vha seq-funksjonen. Kall variablen ID.

Oppgave 2

Lag en variabel som inneholder tallene 2,2,1,1 i denne rekkef?lgen, vha rep-funksjonen. Kall variablen gruppe.

Oppgave 3

Lag en variabel som heter respons, der mulige kategorier er d?rlig, middels og god. Du kan fordele respons p? de fire deltakerne som du selv vil. Husk at denne variablen b?r endres til ? v?re en ordnet faktor.

Oppgave 4

Sett alle variabler sammen til et datasett (data frame). Du kan kalle datasettet for pasientData

Oppgave 5

Skriv ut case nr 2, deretter variabel 3, og til slutt verdien til variabel nr 3 for case nr 2.

Oppgave 6

Skriv ut alle caser bortsett fra case nr 1.

Del 2

Oppgave 1

Basert p? den informasjonen du kan f? fra str(data$variabel) og summary(data$variabel), kan du finne ut hvilke ?r du har data fra?

Oppgave 2

Hva skjer om du kombinerer summary-funksjonen med as.factor(data$variabel) for ?rstall-variablen? Endrer dette selve datasettet?

Del 3

Oppgave 1

Lag en ny variabel som heter gdpPercap1000, som angir BNP (GDP) per innbygger i 1000 USD istedenfor i USD.

Oppgave 2

Regn ut gjennomsnittlig populasjon for 2007 gruppert etter levestandardkategoriene i lifeCat, og tell opp antall land du har i hver av kategoriene (hint: n()).

Oppgave 3

Lag et datasett som kun har dataene fra Argentina, for alle ?r, ved ? velge bare de dataene som har country==“Argentina”. Kall settet gpArgentina.

Del 4

Oppgave 1

Lag en tabell over kategorisk forventet levealder mot kontinent, som viser prosentvis fordeling istedenfor desimaltall.

Oppgave 2

Funksjonen prop.table har et ekstra argument, margin, som kan ta verdier NULL, 1 og 2, der NULL er default. Hva skjer om du setter margin = 1 eller 2 inni prop.table? Det kan v?re lettere ? se om du legger p? addmargins() rundt hele kommandoen.