STK1000: ANDRE SETT MED OBLIGATORISKE OPPGAVER
h?sten 2008
Det andre settet med
obligatoriske oppgaver i STK1000 best?r av to oppgaver, og vil delvis gj?re
bruk av dataene fra f?rste obligatoriske oppgavesett.
I den skriftlige besvarelsen av oppgavene skal du forklare hvordan de enkelte
punktene er l?st, og du skal diskutere resultatene du kommer fram til (der
dette er relevant). Det er valgfritt om du vil skrive besvarelsen for h?nd
eller om du vil bruke et tekstbehandlingsprogram. Der du bruker MINITAB, m? utskrifter og plott inkluderes i besvarelsen.
Obligen skal leveres med en egen forside som du finner
her. Det er lov ? 亚博娱乐官网_亚博pt手机客户端登录e og ? bruke hjelpemidler. Den innleverte besvarelsen skal imidlertid skrives av deg og gjenspeile din forst?else av stoffet. Er vi i tvil om at du virkelig har forst?tt det du har levert inn, kan vi be deg om en muntlig redegj?reslse.
Besvarelsen leveres p? instituttkontoret ved Matematisk Institutt i 7. etasje,
Niels Henrik Abels hus ("matematikkbygningen").
Frist for innlevering er fredag 31. oktober 2008 kl 14.30.
Oppgave 1
Tenk deg at du har et
tilfeldig utvalg (SRS) av st?rrelse n=30 fra en N(10,5)-fordelt
populasjon.
a) Hvilken fordeling f?r gjennomsnittet i et
slikt tilfeldig utvalg? Er det svaret du gir eksakt eller tiln?rmet? Begrunn.
b) Hvor mange av de 50 konfidensintervallene
forventer du vil inneholde den riktige verdien 10?
c) La Y v?re
en stokastisk variabel som angir hvor mange av 50 slike konfidensintervall som
inneholder den riktige verdien 10. Hvilken fordeling har Y? Svaret
ditt m? begrunnes skikkelig!
Du kan bruke MINITAB
til ? simulere den situasjonen som er beskrevet innledningsvis i oppgaven:
- F?rst trekker du 50x30 stokastiske variable som er uavhengige og
N(10,5)-fordelte. Kommando: Calc
> Random Data > Normal. Generer 30
rader med data og ta vare p? dem i kolonnene C1-C50.
Tallene i en kolonne gir deg n? de 30 observasjonene i et tilfeldig
utvalg, mens de 50 kolonnene gir deg de 50 utvalgene.
- S? finner du et 90% konfidensintervall for
hvert av de 50 utvalgene. Kommando: Stat > Basic Statistics
> 1-Sample Z.
d) Utf?r
kommandoene ovenfor og angi de 50
konfidensintervallene du f?r. Hvor mange av dem inneholder den riktige
forventningen 10? Kommenter resultatet i lys av punkt c). e) Bruk de samme simulerte dataene til ?
finne 50 99% konfidensintervall for forventningsverdien i
populasjonen. Forklar hvorfor disse intervallene blir lenger enn intervallene
i d). Hvor mange av de 50 intervallene inneholder n? den riktige forventningen 10? Hvor mange hadde du forventet?
![endif]>![if>
Oppgave 2
Vi er interesserte i ? finne
ut om det er forskjell mellom kj?nnene n?r det gjelder hvilepuls. Til
? unders?ke dette skal du bruke ditt modifiserte puls-datasett
fra oppgave 2 i det f?rste obligatoriske oppgavesettet (se den oppgaven for
detaljer). Siden vi er interessert i hvilepulsen, skal du i hele oppgaven
konsentrere deg om variabelen Pulse1. Husk ? legge inn 1 eller 2 for kj?nn i variabelen Sex i
linje 93, som representerer deg selv.
a) Bruk kommandoen Stat > Basic Statistics > Display Descriptive
Statistics til ? finne gjennomsnittlig hvilepuls
og empirisk standardavvik separat for kvinner og for menn.
b) Lag boksplot av pulsm?lingene for kvinner
og for menn i samme figur, og forklar hvilke av st?rrelsene fra utskriften i
punkt a) du kan finne igjen i boksplottene.
c) For ? svare p? problemstillingen gitt
f?rst i oppgaven, vil vi f?rst anta at den deskriptive oppsummeringen av Pulse1 for
kvinner (Sex=2) gir den sanne forventningen for denne gruppen. Anta
videre at standardavviket for hvilepuls for menn er 10.0 (slag per minutt).
Formuler problemstillingen gitt f?rst i oppgaven som et hypotesetestingsproblem
med nullhypotese og alternativ hypotese. Bruk
resultatene fra punkt a) til ? beregne testobservatoren slik den er gitt p?
side 410 i l?reboka.
Presisering: Du skal teste om forventningen for menn er lik det
observerte gjennomsnittet for kvinner uten ? ta hensyn til usikkerhet
i gjennomsnittet for kvinner. Til sist i oppgaven (under punkt h) skal du ogs? ta
hensyn til denne usikkerheten.
d) Finn P-verdien for testen. Forklar
hvordan denne tolkes og hva resultatet av testen betyr.
e) Gj?r testen direkte ved hjelp av
kommandoen Stat > Basic Statistics >
1-Sample z. Kontroller at resultatene blir de samme som de du fikk i
punktene c) og d).
Du vil her bli n?dt til ? lage et eget arbeidsark
eller "worksheet" som kun inneholder data
for gruppen best?ende av menn (Sex=1). Dette kan du gj?re ved kommandoen Data >
Split Worksheet. I boksen for "By
variable" skriver du 'Sex'. Du f?r da delt opp arbeidsarket
i to deler, en for kvinner og en for menn. I punktene f) og g) nedenfor bruker
du den delen som svarer til menn.
f) Lag et konfidensintervall for
forventet hvilepuls for menn. Ved ? bruke sammenhengen mellom tester og
konfidensintervall, hva blir resultatet av testen da?
g) ? anta at
standardavviket er kjent, er urealistisk. Bruk teorien i avsnitt 7.1 i l?reboka
til ? utf?re en test p? forventningen for gruppen av menn n?r du n? ikke
forutsetter kjennskap til standardavviket. (Du kan her bruke kommandoen Stat
> Basic Statistics > 1-Sample t i MINITAB)
Hvor mange frihetsgrader f?r denne testen?
Sammenlign konfidensintervallet du f?r n?r
det ikke
forutsettes kjent standardavvik med konfidensintervallet i punkt f).
Hva blir dine konklusjoner n??
h) FRIVILLIG, men l?rerik! Antagelsen vi gjorde om at forventningen
til hvilepuls for kvinner var kjent (og identisk med gjennomsnittet), er ikke riktig. Det er
imidlertid mulig ? teste om de to gruppene har forskjellig forventning uten ?
gj?re antagelser om at den ene er kjent. Teorien bak dette er beskrevet i
avsnitt 7.2 i l?reboka.
I MINITAB kan du bruke kommandoen Stat > Basic Statistics > 2-Sample t for ? utf?re en slik test.
Du m? n? g? tilbake til det opprinnelige arbeidsarket
som inneholder dataene for b?de kvinner og menn. Det f?r du fram ved ? klikke
p? Window i hovedmenyen og deretter markere arbeidsarket. I MINITAB har du en
mulighet til ? velge ? anta at standardavvikene for de to gruppene er like eller
ikke.
Utf?r testen ved hjelp av denne kommandoen b?de n?r du antar at
standardavvikene er like og n?r du ikke gj?r det. Diskuter resultatene og
spesielt forskjeller mellom de to testene.
Lykke til!