STK1000: ANDRE SETT MED OBLIGATORISKE OPPGAVER

h?sten 2008

 

Det andre settet med obligatoriske oppgaver i STK1000 best?r av to oppgaver, og vil delvis gj?re bruk av dataene fra f?rste obligatoriske oppgavesett.

I den skriftlige besvarelsen av oppgavene skal du forklare hvordan de enkelte punktene er l?st, og du skal diskutere resultatene du kommer fram til (der dette er relevant). Det er valgfritt om du vil skrive besvarelsen for h?nd eller om du vil bruke et tekstbehandlingsprogram. Der du bruker MINITAB, m? utskrifter og plott inkluderes i besvarelsen.

Obligen skal leveres med en egen forside som du finner her. Det er lov ? 亚博娱乐官网_亚博pt手机客户端登录e og ? bruke hjelpemidler. Den innleverte besvarelsen skal imidlertid skrives av deg og gjenspeile din forst?else av stoffet. Er vi i tvil om at du virkelig har forst?tt det du har levert inn, kan vi be deg om en muntlig redegj?reslse.

Besvarelsen leveres p? instituttkontoret ved Matematisk Institutt i 7. etasje, Niels Henrik Abels hus ("matematikkbygningen").

Frist for innlevering er fredag 31. oktober 2008 kl 14.30.

Oppgave 1

Tenk deg at du har et tilfeldig utvalg (SRS) av st?rrelse n=30 fra en N(10,5)-fordelt populasjon.

a) Hvilken fordeling f?r gjennomsnittet i et slikt tilfeldig utvalg? Er det svaret du gir eksakt eller tiln?rmet? Begrunn.

Tenk deg s? at du har 50 slike tilfeldige utvalg, hvert p? st?rrelse n=30. P? grunnlag av hvert av de 50 utvalgene er det mulig ? finne 50 90% konfidensintervall for forventningsverdien i populasjonen(som vi her vet at er lik 10) ved ? bruke formelen p? side 388 i l?reboka (du skal ikke gj?re dette forel?pig).

b) Hvor mange av de 50 konfidensintervallene forventer du vil inneholde den riktige verdien 10?

c) La Y v?re en stokastisk variabel som angir hvor mange av 50 slike konfidensintervall som inneholder den riktige verdien 10. Hvilken fordeling har Y? Svaret ditt m? begrunnes skikkelig!

Du kan bruke MINITAB til ? simulere den situasjonen som er beskrevet innledningsvis i oppgaven:

  • F?rst trekker du 50x30 stokastiske variable som er uavhengige og N(10,5)-fordelte. Kommando: Calc > Random Data > Normal. Generer 30 rader med data og ta vare p? dem i kolonnene C1-C50. Tallene i en kolonne gir deg n? de 30 observasjonene i et tilfeldig utvalg, mens de 50 kolonnene gir deg de 50 utvalgene.
  • S? finner du et 90% konfidensintervall for hvert av de 50 utvalgene. Kommando: Stat > Basic Statistics > 1-Sample Z.

d) Utf?r kommandoene ovenfor og angi de 50 konfidensintervallene du f?r. Hvor mange av dem inneholder den riktige forventningen 10? Kommenter resultatet i lys av punkt c).

e) Bruk de samme simulerte dataene til ? finne 50 99% konfidensintervall for forventningsverdien i populasjonen. Forklar hvorfor disse intervallene blir lenger enn intervallene i d). Hvor mange av de 50 intervallene inneholder n? den riktige forventningen 10? Hvor mange hadde du forventet?


Oppgave 2

Vi er interesserte i ? finne ut om det er forskjell mellom kj?nnene n?r det gjelder hvilepuls. Til ? unders?ke dette skal du bruke ditt modifiserte puls-datasett fra oppgave 2 i det f?rste obligatoriske oppgavesettet (se den oppgaven for detaljer). Siden vi er interessert i hvilepulsen, skal du i hele oppgaven konsentrere deg om variabelen Pulse1. Husk ? legge inn 1 eller 2 for kj?nn i variabelen Sex i linje 93, som representerer deg selv.

a) Bruk kommandoen Stat > Basic Statistics > Display Descriptive Statistics til ? finne gjennomsnittlig hvilepuls og empirisk standardavvik separat for kvinner og for menn.

b) Lag boksplot av pulsm?lingene for kvinner og for menn i samme figur, og forklar hvilke av st?rrelsene fra utskriften i punkt a) du kan finne igjen i boksplottene.

c) For ? svare p? problemstillingen gitt f?rst i oppgaven, vil vi f?rst anta at den deskriptive oppsummeringen av Pulse1 for kvinner (Sex=2) gir den sanne forventningen for denne gruppen. Anta videre at standardavviket for hvilepuls for menn er 10.0 (slag per minutt). Formuler problemstillingen gitt f?rst i oppgaven som et hypotesetestingsproblem med nullhypotese og alternativ hypotese. Bruk resultatene fra punkt a) til ? beregne testobservatoren slik den er gitt p? side 410 i l?reboka.

Presisering: Du skal teste om forventningen for menn er lik det observerte gjennomsnittet for kvinner uten ? ta hensyn til usikkerhet i gjennomsnittet for kvinner. Til sist i oppgaven (under punkt h) skal du ogs? ta hensyn til denne usikkerheten.

d) Finn P-verdien for testen. Forklar hvordan denne tolkes og hva resultatet av testen betyr.

e) Gj?r testen direkte ved hjelp av kommandoen Stat > Basic Statistics > 1-Sample z. Kontroller at resultatene blir de samme som de du fikk i punktene c) og d).
Du vil her bli n?dt til ? lage et eget arbeidsark eller "worksheet" som kun inneholder data for gruppen best?ende av menn (
Sex=1). Dette kan du gj?re ved kommandoen Data > Split Worksheet. I boksen for "By variable" skriver du 'Sex'. Du f?r da delt opp arbeidsarket i to deler, en for kvinner og en for menn. I punktene f) og g) nedenfor bruker du den delen som svarer til menn.

f) Lag et konfidensintervall for forventet hvilepuls for menn. Ved ? bruke sammenhengen mellom tester og konfidensintervall, hva blir resultatet av testen da?

g) ? anta at standardavviket er kjent, er urealistisk. Bruk teorien i avsnitt 7.1 i l?reboka til ? utf?re en test p? forventningen for gruppen av menn n?r du n? ikke forutsetter kjennskap til standardavviket. (Du kan her bruke kommandoen Stat > Basic Statistics > 1-Sample t i MINITAB)

Hvor mange frihetsgrader f?r denne testen?

Sammenlign konfidensintervallet du f?r n?r det ikke forutsettes kjent standardavvik med konfidensintervallet i punkt f).
Hva blir dine konklusjoner n??

h) FRIVILLIG, men l?rerik! Antagelsen vi gjorde om at forventningen til hvilepuls for kvinner var kjent (og identisk med gjennomsnittet), er ikke riktig. Det er imidlertid mulig ? teste om de to gruppene har forskjellig forventning uten ? gj?re antagelser om at den ene er kjent. Teorien bak dette er beskrevet i avsnitt 7.2 i l?reboka.
I MINITAB kan du bruke kommandoen Stat > Basic Statistics > 2-Sample t for ? utf?re en slik test. Du m? n? g? tilbake til det opprinnelige arbeidsarket som inneholder dataene for b?de kvinner og menn. Det f?r du fram ved ? klikke p? Window i hovedmenyen og deretter markere arbeidsarket. I MINITAB har du en mulighet til ? velge ? anta at standardavvikene for de to gruppene er like eller ikke.
Utf?r testen ved hjelp av denne kommandoen b?de n?r du antar at standardavvikene er like og n?r du ikke gj?r det. Diskuter resultatene og spesielt forskjeller mellom de to testene.

Lykke til!