Sensorveiledning eksamen h?st 2016
Noen momenter ved vurdering av eksamen
PSY1010 – PSYC1100 v?ren 2016.
Generelt:
Denne veiledningen peker p? noen enkeltelementer som kan diskuteres i oppgavene. Den er ikke dekkende eller ment som en fullstendig liste, og skal ikke betraktes som absolutte krav. Oppgavene kan l?ses p? mange m?ter og i tilfeller der kandidaten har benyttet en uortodoks l?sning blir sensor n?dt til ? vurdere hvorvidt l?sningen kan regnes som akseptabel.
Som en regel skal kandidaten bel?nnes for ? vise forst?else av faget og de prinsipielle sidene av metodestoffet. I tilfeller der kandidaten trekker inn kunnskap fra andre omr?der av faget eller tilgrensende fagomr?der enn det som direkte sp?rres etter i det enkelte sp?rsm?l m? man vurdere relevansen. Er stoffet gjort relevant for sp?rsm?let skal dette honoreres. I tilfeller der stoffet ikke er s?rlig relevant og mer b?rer preg av ”Jeg kan ogs? dette” skal man se bort fra dette.
Legg vekt p? forst?else og oversikt av stoffet n?r dere leser oppgavene. Kandidater som viser god oversikt og forst?else b?r honoreres. Det er ogs? flott hvis kandidaten klarer ? illustrere poengene sine med gode eksempler.
Ved regneoppgaver b?r man i tillegg til svaret ogs? vurdere m?ten utregningen er gjort p?. I tilfeller der galt svar ?penbart bare skyldes enkle regnefeil b?r man ta hensyn til dette i vurderingen av svaret. Merk at for de som ikke har med kalkulator, er det viktig at kandidaten viser utregningene og forst?else for fremgangsm?ten.
Alle fire oppgaver teller like mye og kandidaten f?r ikke trekk eller bonus for ? velge noen framfor noen andre. Det skal heller ikke krediteres om kandidaten har svart p? alle fire, i stedet for tre.
Vedr?rende deloppgavene, er det med hensikt at noen oppgaver er vanskeligere enn andre. Dette gj?r det lettere ? sette karakter, og det er ikke meningen at sensor skal v?re like streng p? alle.
Oppgave 1
Et universitet hyrer deg inn for ? kartlegge alkoholbruk blant studentene og hvordan det p?virker resultatene de oppn?r. Data blir samlet inn ved at du deler ut sp?rreskjema til studenter som er tilstede p? utvalgte forelesninger.
De 14 f?rste studentene oppga at de drakk f?lgende antall alkoholenheter per uke:
0, 0, 0, 1, 2, 3, 3, 4, 4, 5, 7, 7, 8, 12
a) Hva er uavhengig og avhengig variabel i denne unders?kelsen?
Kan besvares kort med alkoholbruk som uavhengig variabel og oppn?dde resultater som avhengig variabel. Ufyllende svar kan gjerne honoreres.
b) Hva slags utvalg har vi med ? gj?re? Hvordan p?virker utvalgsteknikken tolkningen av resultatene?
Sammenheng mellom populasjon og utvalg – utvalget skal v?re en ?miniatyrkopi? av populasjonen. Kandidaten kan godt definere populasjon, sampling frame og utvalg og nevne ulike utvalgsteknikker. If?lge oppgaveteksten er vi interessert i alkoholbruk blant studentene ved et universitet. Dette er et ikke-tilfeldig utvalg (nonrandom sample). (Dette er dekket i pensumboka, fra side 165.) Kan ogs? kalles studentutvalg, men ikke-tilfeldigheten b?r diskuteres. Bonus til studenter som kaller det bekvemmelighetsutvalg (convenience sample), eller argumenterer for at det er en slags cluster-sampling (dette er sagt p? forelesning). Det at utvalget er ikke-tilfeldig kan f?re til bias ved at ikke alle har samme sannsynlighet for ? delta. Det b?r komme tydelig fram at dette ikke er et vanlig randomisert utvalg. Sampling frame, selektivt frafall og responsrate kan p?virke resultatene. Bias ved at kun de fremm?tte kan delta i studien. Kandidaten kan ogs? fortelle om alternative utvalgsteknikker og i s? fall skal det bel?nnes om kandidaten forklarer hvordan de ville gitt en annen/bedre tiln?rming til problemstillingen.
c) Regn ut tre m?l p? sentraltendens (gitt tallene over) og forklar kort hva de betyr.
Gjennomsnitt 4, median 3,5, modus/modalverdi 0. Likt fordelt p? alle, drikker de 4 enheter, midterste verdi er 3,5 (snitt av 3 og 4 ettersom partall antall verdier), vanligste verdi er 0. Kandidaten b?r kommentere hvorfor vi f?r ulike verdier, og kommentere p? hva dette betyr. Avvik mellom median, gjennomsnitt og modus finner vi ved skeivfordelte variabler. Aritmetisk gjennomsnitt p?virkes sterkest av uteliggere.
d) Regn ut standardavviket (SD). Hva forteller det oss?
Standardavviket er 3,53009. Ved 3,5 skal dette anses som riktig, ved andre verdier m? det vurderes hvor i utregningen det har g?tt feil. Noen kandidater hadde ikke med kalkulator, hvilket gj?r det vanskelig ? regne ut kvadratrot. Variansen er 12,46, s? uten kalkulator b?r man kunne gjette seg til at det er et sted mellom 3 og 4. Men i alle fall kandidaten vise utregningen. Viktigere er det likevel at kandidaten forst?r hva standardavviket er. Kandidaten m? forst? at standardavviket er et m?l p? spredning, og det b?r framkomme at SD kan overf?res direkte til den skalaen m?lingen er gjort p? (positivt om det nevnes at det til forskjell fra varians, som er kvadrert). Standardavviket tolkes som verdiens gjennomsnittlige avstand fra gjennomsnittet. Teller positivt om kandidaten kommenterer vs. gjennomsnittlig avvik fra gjennomsnittet og gjennomsnittlig absolutt avvik til gjennomsnittet. Det skal honoreres om kandidaten kommenterer forholdet mellom SD og varians og/eller forholdet mellom SD og standardfeil. Honorer hvis kandidaten viser til normalfordelingskurven og den prosentvise fordelingen ligger innenfor standardavviket (for eksempel at 68,2% av fordelingen vil ligge +/- 1 SD fra gjennomsnittet for normalfordelte variabler). Ogs? fint om kandidaten forklarer hvorfor n-1 er nevner.
Oppgave 2
I et stort utvalg tester du om det er slik at studieretning er assosiert med alkoholforbruk. Totalt sammenligner du 5 forskjellige studieretninger. Du gjennomf?rer en signifikanstest p? forskjellen mellom gruppene og finner en p-verdi p? 0,026 (p = ,026). Alfa er 0,05.
a) Hva menes med nullhypotese, alternativ hypotese, type 1- og type 2-feil?
Forklare prinsippet bak H0 og H1. Forklare at det er 4 ulike beslutninger man kan ta i forhold til ? beholde eller ? avvise H0, hvorav to f?rer til riktige beslutninger mens de to andre er feilslutninger. Vise at kandidaten har forst?tt at dette er forhold som gjelder forskjell i gjennomsnitt mellom gruppene i populasjonen. Risiko for type 1 feil kan justeres med alfa, sannsynlighet for type 1 og type 2 feil p?virker hverandre gjensidig. Kandidaten kan diskutere antagelser om ?rsaksforklaring.
b) Hvilken type test ville du benyttet for ? regne ut signifikansen i denne unders?kelsen? (Begrunn svaret ditt).
Her er flere svar mulig, men her b?r kandidaten vise til at det er fem gjennomsnitt som skal vurderes og at man derfor b?r bruke ANOVA. Kandidaten b?r kommentere p? hvorfor vi ikke gj?r en rekke parvise t-tester (samlet feilrate). (ANOVA er godt dekket i pensum, s? svarer kandidaten at vi burde brukt en rekke (uparede) t-tester b?r det gi en noe uttelling.) Det er et pluss hvis kandidaten viser til at det er uavhengige grupper og at man derfor skal benytte enveis mellomgruppe variansanalyse. Noen kandidater kan her g? inn p? en dypere forklaring av variansanalyse. Vurder svaret og om det er gjort relevant og viser forst?else av prinsippet om partisjonert varians.
c) Forklar hva som menes med p = ,026 i denne sammenhengen? Er resultatet statistisk signifikant, og hva betyr i s? fall det?
Resultater er signifikant, og man tolker dette som at det er en forskjell i gjennomsnittlig alkoholbruk mellom de 5 ulike studieretningene. Kandidaten b?r f? fram at signifikans dreier seg om sannsynlighet for at et gitt resultat i utvalget skal oppst? tilfeldig, gitt at det ikke er noen forskjell i populasjonen. Positivt hvis kandidaten eksplisitt nevner at sannsynlighet under nullhypotesen ikke er det samme som sannsynlighet for H0 eller H1 som s?dan. Ogs? positivt om kandidaten nevner forskjell mellom assosiasjon og kausalitet, og at dette ikke er en randomisert studie, som ikke sier noe om ?rsak. Kriteriet for ? avvise H0 kalles for alfa niv?et. Som en konvensjon brukes et sannsynlighetsniv? p? 0,05 eller 0,01 (her 0,05). Utregningen av signifikansniv?et er avhengig av det resultatet som er oppn?dd i utvalget sammen med andre forhold som spredning og utvalgets st?rrelse. Noen kandidater kan her vise til at sannsynligheten beregnes ut fra samplingsfordelingen. Hvis dette er forst?tt b?r dette honoreres ekstra.
d) Du kan ogs? legge inn variabelen kj?nn i analysen. Hvorfor kan det v?re lurt og hva kaller vi en slik analyse?
Denne oppgaven er vanskelig, og er ment ? skille mellom gode kandidater. Her kan kandidaten svare flere ting. Kandidatene m? reflektere rundt hvordan kj?nn kan p?virke assosiasjonen mellom studieretning og alkoholbruk, for eksempel at kj?nn kan v?re korrelert med avhengig og uavhengig variabel. N?r det gjelder hva analysen heter er det riktigste ? bruke en ANCOVA, og m? telles som bonus om kandidaten klarer dette. Det kan ogs? argumenteres for ? bruke en toveis variansanalyse. Ved ANCOVA kan kandidaten si noe om at kj?nn korrelerer med studieretning og at kovariansanalyse kontrollerer for denne effekten. Argumenteres det for toveis ANOVA b?r kandidaten si noe om hvordan man tenker seg kj?nn benyttet som uavhengig variabel.
Oppgave 3
Du finner at depresjon og antall timer s?vn ser ut til ? ha en sammenheng med hverandre.
a) Korrelasjonen mellom de to variablene er r = - 0.40. Hva betyr det?
Kandidaten b?r forklare prinsippet om samvariasjon. Bra om kandidaten viser til at korrelasjon er basert p? naturlig variasjon til forskjell fra eksperimentet som benytter p?f?rt variasjon under kontrollerte betingelser. I tillegg til ? svare at det er negativ korrelasjon mellom variablene er det et pluss hvis kandidaten sier hvorfor og diskuterer styrkeforholdet til korrelasjonen. Kandidaten kan selv velge hva som er x og y, i forelesningen var depresjon x og s?vn y, da vil en negativ korrelasjon v?re at n?r x (depresjon) g?r ned, g?r y (s?vn) opp. Variablene g?r i motsatt retning. En r p? 0.40 er p? forelesning vurdert som en lav korrelasjon. Er negativ, positive og nullkorrelasjon ogs? forklart er det et pluss selv om det ikke sp?rres eksplisitt etter dette i oppgaven.
b) Hva forst?r du med delt varians (Coefficient of determination) i denne sammenhengen, og hvor stor er den?
Kandidaten b?r ha forst?tt at delt varians er ? ta r2 (0.4x0.4=0.16). Dette betyr at depresjon og s?vn deler 16% varians (noks? lite). I noen tilfeller er selve utregningen feil, men det skal ikke tillegges alt for stor vekt s? lenge prinsippet er forst?tt. Det er et pluss hvis kandidaten sier noe om overgangen fra ordinalniv? til intervallniv? n?r vi g?r fra r til r2, men det er ikke forventet.
c) Hvorfor skal man v?re forsiktig med ? trekke slutninger om ?rsak og virkning fra korrelasjonsdata? Her st?r kandidaten fritt til ? forklare med egne ord. Vi har snakket mye om ? skille mellom korrelasjon og kausalitet, samt korrelasjonsmetoden begrensninger: det at ?rsaksretning kan g? begge veier, tredjevariabler og spuri?se sammenhenger. Ved antagelser om ?rsak m? rivaliserende hypoteser utelukkes da disse kan forklare korrelasjonen, og det er vanskelig ? gjennomf?re i praksis n?r man studerer sammenhenger som opptrer i en naturlig setting.
d) Regresjonsanalyse kan ofte betraktes som en videref?ring av korrelasjon. Forklar hvorfor. (Bruk gjerne de to variablene over som eksempel)
Her m? kandidaten kunne gj?re rede for at regresjonsanalyse en metode som sier noe om forholdet mellom variabler, og det er det mulig ? predikere verdien p? en variabel ved hjelp av en annen (ikke n?dvendigvis kausalitet). Her er prediktor den uavhengige variabelen x og kriteriet den avhengige variabelen y. Man sp?r: Hva skjer med y n?r x ?ker med én? Her kan kandidaten forklare at man trekker en rett linje (regresjonslinjen) gjennom fordelingen av sk?rer p? en slik m?te at man minimerer summen av de kvadrerte avstandene mellom hvert observasjonspunkt og linjen. Det er et pluss hvis studentene ogs? har forst?tt at residualene er restleddet eller forskjellen p? predikert (etimert) sk?re og observert sk?re, alts? uforklart varians.
e) Ligningen for bivariat line?r regresjon kan skrives som: ?= a + bX. Hva uttrykker de ulike symbolene i ligningen? Studenten b?r kunne vise og forklare at a = interceptet/skj?ringspunktet (hvor linjen krysser y aksen) og at b= regresjonsvekten/stigningstallet. ? = predikert y-verdi og x = sk?ren det predikeres fra. M?let er ? forutsi hva y blir for andre x verdier enn de vi har m?lt. Stort pluss om de av eget initiativ illustrerer dette med et relevant eksempel hvor de bruker formelen i praksis.
Oppgave 4
Disse deloppgavene (a, b, c) er n?rt knyttet til hverandre, og besvarelsene kan lett gli over i hverandre fordi man kommer inn p? de ulike temaene n?r man besvarer én av oppgavene. Vis derfor forst?else hvis kandidaten hopper noe frem og tilbake i fremstillingen, eller forteller at det har de allerede besvart i forrige deloppgave.
I eksperimentell forskning snakker vi om to hoveddesign: mellomgruppe (Between-subjects) og innen gruppe- eller repeterte design (Within-subjects).
a) N?r benyttes de to designene og hvilke fordeler og ulemper har de?
Her er det mulig ? skrive mye, men hovedkjernen er at mellomgruppe er n?r ulike grupper av deltagere inng?r i hver betingelse/manipulering (uavhengige grupper), og innengruppedesign er med samme person/gruppe i alle betingelser. Det er et pluss om kandidaten er inne p? forskjellen mellom det at samme person/gruppe inng?r i samtlige betingelser og p? den m?ten inng?r som kontroll for seg selv, kontra at forskjellige personer inng?r i ulike betingelsene. Mellomgruppedesign med uavhengige grupper brukes n?r vi har lett tilgang p? deltakere og n?r deltakerne ikke er veldig forskjellige p? relevante variabler. Innengruppedesign brukes n?r det er kostbart ? bruke ulike fors?kspersoner, eller ved mangel p? fors?kspersoner. Fordelene er at det blir mindre variasjon som skyldes variasjon mellom personer, dvs. lettere ? oppdage eksperimentell effekt. Som eksempler p? ulemper/fordeler kan ogs? studenten ogs? trekke inn ulike svakheter/trusler mot den indre validiteten som gjelder for hvert av de to ulike designene.
b) Hva menes med ytre og indre validitet i eksperimenter?
Her skal de kun nevne validitet for eksperimenter. De m? forklare at indre validitet handler om slutninger om ?rsaksbetingelser i et eksperiment. Ytre validitet er om resultatene har en generaliseringsverdi, at det ogs? er gyldig for ?verden utenfor?. Pluss hvis de nevner at dette kan v?re motstridende i et eksperiment, jo strengere kontroll over confunderende variabler jo mindre systematisk feilvarians og bedre indre validitet, men det kan bidra til at generaliserbarheten blir d?rligere fordi testsituasjonen kan bli kunstig ved ?nske om h?y kontroll (som i noen laboratoriestudier). Her er det et stort pluss om kandidaten ser at mellomgruppedesign med uavhengige grupper lettere oppn?r god ytre validitet mens innengruppedesign har en fordel mht indre validitet.
c) Forklar hvorfor overf?ringseffekter (Carryover effects) blir sett p? som en trussel mot validiteten i repeterte design (Within-subjects).
Ved repeterte design er det en risiko for at tidligere m?ling har smitteeffekt ved at erfaring fra en betingelse overf?res til neste betingelse. Det p?virker resultatet i studien. Pluss hvis dette sees i sammenheng med confunderende variabler. Ulike typer av overf?ringseffekter b?r v?re nevnt. Pensum nevner 6 stk spesifikt: treningseffekter, uttr?ttingseffekter, habituering, sensitivisering, kontraster og adaptasjon. Overf?ringseffekter gir opphav til systematisk feilvarians som er et problem for indre/intern validitet.
d) Hva kan man gj?re for ? minimere betydningen av overf?ringseffekter?
Her b?r studenten kunne si noe om full motbalansering og delvis motbalansering, og problemet som oppst?r hvis overf?ringen fra variabel A til variabel B ikke er den samme som fra B til A.
Boka diskuterer latin square design og muligheten for ? omgj?re rekkef?lgen av betingelser som en uavhengig variabel, samt hvordan man kan minimere faren for effekter gjennom gode design, for eksempel ved ? gi treningsrunder f?r man samler inn data. I forhold til problemer med longitudinelle design er det et stort pluss hvis kandidaten har tatt opp s?kalte kohort- sekvensielle design (kombinasjon av longitudinelle og tverrsnittdesign), men det er ikke forventet.