STK1000: FØRSTE SETT MED OBLIGATORISKE OPPGAVER

Våren 2006

 

Oppgavesettet består av tre oppgaver. Deler av oppgave 1 skal du gjøre for hånd og ved hjelp av lommeregner, deler ved hjelp av MINITAB. I oppgavene 2 og 3 skal du benytte MINITAB. I forbindelse med bruk av MINITAB vil du ha nytte av notatet Starthjelp i MINITAB, som blir kalt "innføringsheftet" nedenfor. Det er tilgjengelig på kurshjemmesiden.

I den skriftlige besvarelsen av oppgavene skal du kort forklare hvordan de enkelte punktene er løst. Det er valgfritt om du vil skrive besvarelsen for hånd eller om du vil bruke et tekstbehandlingsprogram. Der du bruker MINITAB, må relevante utskrifter og plott legges ved eller limes inn i besvarelsen. Instruksjoner for utskrift fra MINITAB finner du i avsnitt 10 i innføringsheftet.

I øverste høyre hjørne av besvarelsen skal du skrive (tydelig!) navn. Hvis flere 亚博娱乐官网_亚博pt手机客户端登录er om å løse oppgaven, må likevel hver student ha formulert og skrevet den besvarelsen som leveres inn. Du kan bli bedt om å redegjøre muntlig for innholdet i oppgaven. Det må gå frem av besvarelsen hvem du har 亚博娱乐官网_亚博pt手机客户端登录et med.

Besvarelsen leveres på instituttkontoret ved Matematisk Institutt i 7. etasje, Niels Henrik Abels hus ("matematikkbygningen").

Frist for innlevering er fredag 24. februar kl 14.30.


Oppgave 1

Punktene a) — d) skal besvares manuelt, dvs. for hånd eller ved hjelp av lommeregner.

I oppgave 1.34, side 37 i boka er det gitt 29 målinger av jordklodens tetthet. Du finner datasettet igjen her.

a) Del intervallet fra minste til største observasjon opp i passende delintervaller og tell opp antall observasjoner i hvert delintervall.

b) Tegn for hånd et histogram for de 29 obervasjonene. Kommenter histogrammets utseende.

c) Finn gjennomsnitt og median i datasettet. Hva gir disse to størrelsene utrykk for?

d) Finn standardavvik og kvartilavstand ("interquartile range") for målingene av jordklodens tetthet. Hva gir disse to størrelsene uttrykk for?

e) Skriv eller kopier observasjonene inn i et arbeidsark i MINITAB (jfr. avsnitt 5 i innføringsheftet), og benytt MINITAB til å lage et histogram. Kommandoen er: Graph -> Histogram; jfr. avsnitt 8.3 i innføringsheftet. Sammenlign med histogrammet du lagde manuelt i punkt b).

f) Benytt MINITAB til å beregne gjennomsnitt, median, standardavvik og kvartilavstand. Her kan du bruke kommandoen: Stat -> Basic Statistics -> Display Descriptive Statistics; jfr. avsnitt 8.1 i innføringsheftet. Får du samme resultat som i punktene c) og d)? Kommenter eventuelle avvik.




Oppgave 2

I denne oppgaven skal vi se på noen data som er samlet inn under et innføringskurs i statistikk ved et amerikansk universitet. Studentene i kurset gjennomførte et enkelt forsøk. Hver student noterte sin høyde og vekt og målte pulsen sin (under hvile). Så kastet hver av studentene en mynt. De som fikk krone løp på stedet i ett minutt, mens de som fikk mynt ble sittende stille i ett minutt. Så målte alle pulsen en gang til (for de som satt stille, er dette en måling til av pulsen under hvile). Dataene for de 92 studentene er gitt i en Minitabfil. Eventuelt kan du lese dem som en vanlig tekstfil, som du kan kopiere inn i et arbeidsark i MINITAB. På datafilen er det en linje for hver av de 92 studentene, mens variablene i kolonnene har følgende betydning:
  • Pulse1:  Første pulsmåling (antall slag per minutt)
  • Pulse2:  Andre pulsmåling (antall slag per minutt)
  • Ran:        1=løp på stedet; 2=satt stille
  • Sex:        1=mann; 2=kvinne
  • Height:   høyde i inches (1 inch = 2,54 cm)
  • Weight:   vekt i pounds (1 pound =0,454 kg)
Når du har lastet dataene inn i MINITAB, registrerer du dine egne verdier for variablene Sex, Height og Weight i linje 93 i arbeidsarket (husk å regne om til hhv. inches og pounds). Mål pulsen din under hvile og registrer den som Puls1. Kast så et kronestykke. Hvis det viser krone, løper du på stedet i ett minutt. Hvis ikke sitter du stille ett minutt. Så måler du pulsen din igjen og registrer den som Puls2 i linje 93 i arbeidsarket. Skriv også inn din verdi for Ran (1 hvis du løp, 2 hvis du satt stille).

Med dette modifiserte datasettet:

a) Beregn enkle oppsummerende mål for variablene Pulse1 og Height. Hvordan ligger dine egne verdier i dette bildet?

b) Lag histogram og stilk-plott for de samme variablene, og merk av dine egne verdier. Stilk-plott lages med Graph -> Stem-and-Leaf.

c) Lag grafiske framstillinger av hvordan variablene Pulse1 og Pulse2 avhenger av aktivitet (dvs. av variabelen Ran). Kommenter plottene.

d) Gjennomfør en regresjonsanalyse med vekt som responsvariabel og høyde som forklaringsvariabel. Forklar hva resultatene av regresjonsanalysen forteller deg. Lag et plott av obervasjonene og den tilpassede regresjonslinja. Kommandoer er her: Stat -> Regression -> Regression og Stat -> Regression -> Fitted Line Plot.




Oppgave 3

Denne oppgaven er essensielt oppgave 2.106 på side 186 i læreboka. De to datasettene i oppgave 2.106 (ett for kvinner og ett for menn) er fremkommet ved at man har latt et antall eliteløpere løpe på tredemølle ved bestemte hastigheter ('Speed', som her betraktes som forklaringsvariabel), og målt stegfrekvensen (antall steg per sekund) ved hver hastighet. Responsvariabel er gjennomsnittlig stegfrekvens for henholdsvis kvinnelige og mannlige løpere ('Stride rate'). En enkel måte å organisere dataene på i MINITAB er å lage seks kolonner: speed, stride rate kvinner, stride rate menn, to dobbelt så lange kolonner for speed og stride rate der datasettene for kvinner og menn ligger etter hverandre. Til slutt lager du en kolonne for en kategorisk variabel som angir om individene i to siste kolonnene er kvinner eller menn. De tre første kolonnene må du lage manuelt. De to neste kan du lage manuelt eller ved å bruke Data -> Stack -> Columns. Den siste kolonnen må du lage manuelt.

a) Plott først dataene for hastighet og stegfrekvens. Her lager du tre figurer: Først en der dataene plottes i samme figur, men med ulike plottesymboler for menn og kvinner, dernest en der det legges inn en felles regresjonslinje og til slutt en der det legges inn separate regresjonslinjer. Plottene kan du lage med kommandoen Graph -> Scatterplot. På bildet som kommer fram kan du spesifisere de tre typene av plott som er beskrevet ovenfor ved With Groups, With Regression og With Groups and Regression henholdsvis. Du trenger den sjette kolonnen, som identifiserer kvinner og menn, for å lage det første og siste av plottene.

b) Anta nå at du fikk dataene uten identifikasjon av kjønn. Beregn koeffisientene for minste kvadraters linje for alle dataene. Bruk de to kolonnene der dataene for kvinner og dataene for menn er slått sammen.

c) Lag plott av residualene fra linjen i punkt b) mot rekkefølgen av observasjonene og mot hastighet. Forklar hvordan det vises i plottet at dataene kommer fra to forskjellige grupper. Kommandoene er her Stat -> Regression -> Regression. Klikk på Graphs og be om å få plottet (i) residualene mot rekkefølgen av observasjonene og (ii) residualene mot hastighet.

d) Beregn så regresjonslinjer separat for hvert kjønn. Hva blir korrelasjonen mellom hastighet og stegfrekvens i hvert av tilfellene? Hva sier disse korrelasjonene om regresjonslinjene?

e) Lag plott av residualene fra hver av de to linjene fra punkt d) mot hastighet. Kommenter plottene!