WEBVTT 1 00:00:00.810 --> 00:00:04.440 Hei. Jeg heter Solveig Hillesund og foreleser ved STV1020. 2 00:00:04.980 --> 00:00:08.070 I denne videoen skal jeg vise hvordan statistiske slutninger som, som 3 00:00:08.670 --> 00:00:12.930 konfidensintervaller og hypotesetester, bygger p? sentralgrenseteoremet og 4 00:00:12.930 --> 00:00:15.090 normalfordelingskurven, via samplingfordelingen. 5 00:00:17.130 --> 00:00:22.050 Jeg kommer ogs? innom forskjellen p? en-halede og to-halede hypotesetester og 6 00:00:22.050 --> 00:00:27.220 hvordan signifikanstester med t- og p-verdier henger sammen. 7 00:00:27.220 --> 00:00:31.510 Det dere trenger ? vite om sentralgrenseteoremet er at statistikere har 8 00:00:31.510 --> 00:00:36.970 funnet ut at hvis vi trekker et stort, eller egentlig uendelig, antall utvalg s? vil 9 00:00:36.970 --> 00:00:41.170 gjennomsnittene i utvalgene bli normalfordelt. 10 00:00:41.170 --> 00:00:46.660 Vi kaller denne hypotetiske fordelingen for samplingfordelingen, fra sampling 11 00:00:46.660 --> 00:00:51.520 distribution p? engelsk og det at den er normalfordelt,det legger hele grunnlaget for 12 00:00:51.520 --> 00:00:57.250 at vi kan sette tall p? usikkerheten n?r vi gj?r statistiske slutninger fra et utvalg til 13 00:00:57.250 --> 00:01:04.090 en populasjon. N?r noe er normalfordelt s? vet vi hvor stor del av arealet under kurven 14 00:01:04.630 --> 00:01:08.740 som svarer til hver bit av x-aksen. 15 00:01:08.740 --> 00:01:14.500 For samplingfordelingen s? vil det si at vi vet hvor stor andel av alle tenkelige eller 16 00:01:14.500 --> 00:01:21.100 hypotetiske utvalg som ligger langt fra eller n?rme populasjonens sanne gjennomsnitt 17 00:01:21.430 --> 00:01:24.640 som dere ser i midten av figuren her. 18 00:01:24.640 --> 00:01:29.860 Og dermed vet vi hvor sannsynlig det er at gjennomsnittet i akkurat dette utvalget vi 19 00:01:29.860 --> 00:01:36.370 har trukket ligger n?rme eller langt fra det sanne gjennomsnittet i populasjonen. 20 00:01:36.370 --> 00:01:43.330 For eksempel, hvis vi beveger oss omtrent to standardavvik, eller egentlig 1,96, i hver 21 00:01:43.330 --> 00:01:50.650 retning ut fra midten, gjennomsnittet, p? en standard normalfordelingskurve s? dekker vi 22 00:01:50.650 --> 00:01:55.180 95 prosent av arealet under kurven. 23 00:01:55.180 --> 00:02:02.230 For samplingfordelingen s? vil det si 95 prosent av de hypotetiske utvalgene vi kunne 24 00:02:02.230 --> 00:02:11.380 trukket ligger innen to standardavvik fra det sanne gjennomsnittet i populasjonen. 25 00:02:11.380 --> 00:02:17.260 Denne innsikten bruker vi til ? sette tall p? usikkerhet og presisjon i to typer 26 00:02:17.350 --> 00:02:18.630 statistiske slutninger. 27 00:02:20.200 --> 00:02:26.110 I analyser med ¨Śn variabel, univariat analyse, s? bruker vi den til ? regne ut 28 00:02:26.110 --> 00:02:30.760 konfidensintervall og feilmargin rundt for eksempel et gjennomsnitt. 29 00:02:32.000 --> 00:02:36.980 S? la oss se p? logikken bak et 95 prosent konfidensintervall. 30 00:02:36.980 --> 00:02:42.500 N?r vi trekker et tilfeldig utvalg s? er vi alltid 95 prosent sikre p? at utvalget ligger 31 00:02:42.500 --> 00:02:48.990 innen det skraverte omr?det p? figuren, pluss minus to standardavvik fra 32 00:02:48.990 --> 00:02:50.940 populasjonens sanne gjennomsnitt. 33 00:02:51.690 --> 00:02:58.080 Det vet vi rett og slett fordi 95 prosent av alle hypotetiske utvalg vil ligge der. 34 00:02:58.080 --> 00:03:04.500 S? lenge vi har godt over hundre enheter s? regner vi ut 95 prosent konfidensintervall 35 00:03:04.500 --> 00:03:12.000 ved ? legge p? to standardfeil i hver retning fra estimatet v?rt, alts? fra gjennomsnittet 36 00:03:12.000 --> 00:03:16.020 vi har funnet i utvalget. 37 00:03:16.020 --> 00:03:24.510 Gjennomsnittets standardfeil er det samme som samplingfordelingens standardavvik som er det 38 00:03:24.510 --> 00:03:28.800 vi har p? x-aksen her i figuren. 39 00:03:28.800 --> 00:03:36.450 Som vi ser p? figuren s? gj?r det at hvis det stemmer at v?rt utvalg, estimatet v?rt av 40 00:03:36.450 --> 00:03:44.310 gjennomsnittet, ligger i det gr? omr?det, og det er vi 95 prosent sikre p? at det gj?r, s? 41 00:03:44.310 --> 00:03:50.100 vil et intervall som legger p? to standardfeil i hver retning, konfidens 42 00:03:50.100 --> 00:03:54.900 intervallet alts?, alltid fange opp det sanne gjennomsnittet i populasjonen. 43 00:03:55.410 --> 00:04:01.710 Det vil alltid treffe p? midtlinjen her i fordelingen uansett hvor i det skraverte 44 00:04:01.740 --> 00:04:11.090 omr?det estimatet v?rt, den sorte prikken her,egentlig ligger, og det vet vi alts? ikke 45 00:04:12.650 --> 00:04:19.310 . Dermed s? gj?r konfidensintervallet v?rt at vi kan v?re 95 prosent sikre p? at det sanne 46 00:04:19.310 --> 00:04:25.070 gjennomsnittet i populasjonen ligger mellom den nedre og ?vre grensa som vi har regnet 47 00:04:25.070 --> 00:04:29.170 ut. Vi har satt tall p? estimatets usikkerhet. 48 00:04:29.170 --> 00:04:31.340 5 prosent, og presisjon. 49 00:04:31.760 --> 00:04:36.730 Presisjonen f?lger av hvor smalt eller hvor bredt konfidensintervallet vi har regnet ut 50 00:04:36.730 --> 00:04:45.460 er. I bivariat analyse s? bruker vi sentralgrenseteoremet til hypotesetesting av 51 00:04:45.460 --> 00:04:47.710 sammenhengen mellom to variabler. 52 00:04:48.880 --> 00:04:53.140 Vi tar utgangspunkt i en s?kalt nullhypotese om at det ikke er noen sammenheng mellom 53 00:04:53.140 --> 00:05:00.840 variablene i populasjonen, t er lik null ligger i midten her p? fordelingen. 54 00:05:00.840 --> 00:05:04.870 Hvis det ikke er noen sammenheng i populasjonen s? burde vi som oftest heller 55 00:05:04.870 --> 00:05:08.050 ikke finne noen sterk sammenheng i et tilfeldig utvalg. 56 00:05:08.950 --> 00:05:13.600 S? jo st?rre t-verdi vi finner i et tilfeldig utvalg, jo st?rre grunn er det til 57 00:05:13.600 --> 00:05:18.200 ? tvile p? at det ikke finnes noen sammenheng i populasjonen. 58 00:05:18.200 --> 00:05:23.030 Alts? at det skyldes en tilfeldighet at vi har funnet en i utvalget. 59 00:05:23.030 --> 00:05:28.600 Alts? tvile p? nullhypotesen om at det ikke finnes noen sammenheng i populasjonen, s? den 60 00:05:28.600 --> 00:05:33.730 alternative hypotesen, at det finnes en sammenheng i populasjonen, den styrkes. 61 00:05:35.050 --> 00:05:41.710 Denne samplingfordelingen forteller oss hvor sannsynlig det er ? finne ulike t-verdier i 62 00:05:41.710 --> 00:05:47.880 utvalget v?rt, forutsatt at det ikke finnes noen sammenheng i populasjonen. 63 00:05:47.880 --> 00:05:50.710 S? den fordelingen her, den forutsetter nullhypotesen. 64 00:05:51.800 --> 00:05:59.880 Hypotesetesten handler om ? bruke denne fordelingen til ? sette tall p? 65 00:05:59.880 --> 00:06:06.580 sannsynligheten for at sammenhengen i utvalget bare skyldes tilfeldigheter. 66 00:06:06.580 --> 00:06:13.120 Hvis den sannsynligheten er lav nok s? forkaster vi nullhypotesen om at det ikke 67 00:06:13.120 --> 00:06:18.460 fins noen sammenheng i populasjonen til fordel for den alternative forklaringen at 68 00:06:18.460 --> 00:06:20.290 det faktisk foreg?r noe systematisk. 69 00:06:20.290 --> 00:06:24.850 Vi konkluderer dermed med at det trolig finnes en sammenheng i populasjonen og sier 70 00:06:24.850 --> 00:06:27.250 at vi har funnet en statistisk signifikant sammenheng. 71 00:06:30.350 --> 00:06:37.640 Grensen for hvor lav sannsynligheten m? v?re for at vi forkaster nullhypotesen og sier at 72 00:06:37.640 --> 00:06:39.260 vi har funnet en sammenheng, det kaller vi signifikansniv?et. 73 00:06:41.150 --> 00:06:44.900 Vi velger det selv, men ofte s? bruker vi fem prosent. 74 00:06:44.960 --> 00:06:50.440 Det er det som er vanlig. Etter en s?nn hypotesetest s? er vi fortsatt ikke sikre p? 75 00:06:50.440 --> 00:06:52.140 at det finnes en sammenheng. 76 00:06:52.140 --> 00:06:56.320 Det vil alltid finnes usikkerhet der i statistikken,men hypotesetesting er en 77 00:06:56.320 --> 00:06:59.440 systematisk m?te ? tallfeste denne usikkerheten p?. 78 00:07:01.100 --> 00:07:05.840 Legg merke til en forskjell mellom univariat ogbivariat slutningsstatistikk her. 79 00:07:05.840 --> 00:07:10.660 I univariat analyse s? ?nsker vi ? regne ut et konfidensintervall som dekker 80 00:07:10.660 --> 00:07:15.370 gjennomsnittet, alts? midten, i den samplingfordelingenvi ser p?. 81 00:07:15.370 --> 00:07:22.060 I hypotesetester s? styrker vi hypotesen hvis t-verdien er tilstrekkelig langt unna midten 82 00:07:22.120 --> 00:07:27.630 i samplingfordelingen, for der betyr midten av samplingfordelingen ingen sammenheng, 83 00:07:27.630 --> 00:07:29.230 alts? t lik null. 84 00:07:31.680 --> 00:07:37.290 Og s? er det lett ? tenke p? de ulike typene hypotesetester i kurset, p-verdier, t-verdier 85 00:07:37.290 --> 00:07:39.330 og s? videre, som litt uavhengige av hverandre. 86 00:07:40.320 --> 00:07:47.430 Men de henger faktisk veldig tett sammen og det gj?r de via samplingfordelingen. 87 00:07:47.430 --> 00:07:52.290 Signifikansniv?et som vi velger, det har en tilh?rende kritisk t-verdi og en p-verdi, k 88 00:07:52.740 --> 00:07:54.260 ritisk p-verdi. 89 00:07:54.260 --> 00:07:58.350 Og p? figuren her s? kan du se at de begge svarer til egenskaper ved 90 00:07:58.350 --> 00:08:07.080 samplingfordelingskurven, henholdsvis til x-verdien som avgrenser halene p? kurven og 91 00:08:07.080 --> 00:08:11.080 til arealet inni halene p? kurven. 92 00:08:11.080 --> 00:08:16.080 Og den kritiske verdien vi har valgt ved ? velge signifikansniv?, den sammenligner vi 93 00:08:16.080 --> 00:08:19.210 med en p- eller t-verdi som vi observerer i utvalget v?rt. 94 00:08:19.670 --> 00:08:24.170 P kommer fra statistikkprogrammet eller t som vi regner ut. 95 00:08:24.170 --> 00:08:29.340 Men p og t henger alltid sammen p? en helt forutsigbar m?te. 96 00:08:30.390 --> 00:08:33.720 Med h?yere t-verdi s? f?lger lavere p-verdi 97 00:08:34.340 --> 00:08:40.230 og omvendt. Og grunnen er at de er knyttet til samme kurve, samplingfordelingskurven. 98 00:08:42.300 --> 00:08:48.180 Hvis vi har veldig f? enheter og dermed f? frihetsgraders? bruker vi en litt flatere 99 00:08:48.180 --> 00:08:53.640 versjon av samplingfordelingskurven og det er det de ulike linjene med kritiske 100 00:08:53.640 --> 00:08:56.120 t-verdier i t-tabellen representerer. 101 00:08:56.120 --> 00:08:59.130 Det er ulike s?nne tilpassede kurver. 102 00:09:00.000 --> 00:09:06.050 Men for alle de kurvene s? henger p og t sammen p? samme forutsigbare m?te. 103 00:09:08.250 --> 00:09:12.570 Og til slutt en fotnote om en-halede og to -haledehypotesetester. 104 00:09:13.710 --> 00:09:18.440 For n?r vi snakker om at 95 prosent av alle de hypotetiske utvalgene ligger i midten av 105 00:09:18.440 --> 00:09:25.160 samplingfordelingen og fem prosent i halene, alts? ved fem prosent signifikansniv?, s? 106 00:09:25.170 --> 00:09:30.450 forholder vi oss vanligvis til begge halene p? fordelingen - en symmetrisk hypotesetest. 107 00:09:31.020 --> 00:09:38.850 Da ligger 2,5 prosent i hver hale og tanken er at hypotesetester av denne typen kan 108 00:09:38.850 --> 00:09:40.890 p?vise b?de positive og negative sammenhenger. 109 00:09:42.300 --> 00:09:47.880 Vi kaller det to-halede tester, og hvis ikke noe annet er oppgitt s? er det det som er 110 00:09:47.880 --> 00:09:51.060 standard praksis. 111 00:09:51.060 --> 00:09:55.380 Ganske ofte s? har vi teoretiske grunner til ? forvente at en sammenheng er enten positiv 112 00:09:55.380 --> 00:10:00.100 eller negativ. Vi har en hypotese med retning. 113 00:10:00.100 --> 00:10:03.870 Da hender det at man bruker noe som heter en-halet hypotesetest. 114 00:10:04.500 --> 00:10:11.200 Man velger ? forholde seg bare til den ene halen p? fordelingen, samplingfordelingen, og 115 00:10:11.200 --> 00:10:18.060 Kellstedt og Whitten de argumenterer for at statsvitere b?r bruke s?nne teste mer fordi 116 00:10:18.060 --> 00:10:19.980 vi har mange hypoteser med retning. 117 00:10:21.820 --> 00:10:26.560 Og fremgangsm?ten for en s?nn test er den samme, man sammenligner en kritisk t- eller 118 00:10:26.560 --> 00:10:29.080 p-verdi med en som man observerer i utvalget. 119 00:10:30.070 --> 00:10:35.470 Forskjellen er at man m? finne en annen kritisk t-verdi i t-tabellen eller bruke en 120 00:10:35.470 --> 00:10:37.060 halvparten s? stor p verdi. 121 00:10:39.320 --> 00:10:44.090 Og det siste det skal dere komme tilbake til seinere i semesteret, men forel?pig s? holder 122 00:10:44.090 --> 00:10:50.660 det at dere bruke to-halet test, siden det er vanligst i praksis, men at dere vet hva en 123 00:10:50.660 --> 00:10:57.180 en-halet test er. Men t-tabellen i Kellstedtog Whitten den gjelder for en-halet 124 00:10:57.180 --> 00:11:03.630 test s? derfor kan det v?re greit ? supplere med en t-tabell s?nn som denne som har en 125 00:11:03.630 --> 00:11:10.170 egen rad med overskrifter som er tilpasset for to-halet test, eller ? legge til den 126 00:11:10.170 --> 00:11:15.330 ekstra raden med overskrifter for to-halet test som dere ser her i tabellen til 127 00:11:15.330 --> 00:11:16.050 Kellstedt og Whitten.