WEBVTT 1 00:00:00.720 --> 00:00:03.920 Hei. Jeg heter Solveig Hillesund og foreleser p? STV1020. 2 00:00:04.500 --> 00:00:12.060 I denne videoen skal jeg vise hvordan man sammenligner to gjennomsnitt med t-test uten ? f? p-verdi fra statistikkprogrammet. 3 00:00:12.060 --> 00:00:20.310 For ? gjennomf?re t-test selv s? trenger vi en observert t, en test-observator, og en kritisk verdi til ? sammenligne den med. 4 00:00:20.360 --> 00:00:22.440 Vi kan dele t i to komponenter. 5 00:00:23.070 --> 00:00:30.210 Forskjellen mellom gjennomsnittene vi sammenligner, over streken her, og standardfeilen til forskjellene, under streken. 6 00:00:31.260 --> 00:00:39.300 Legg merke til at det er snakk om standardfeilen til forskjellen, som er noe annet enn standardavviket til en variabel. 7 00:00:39.300 --> 00:00:40.530 Vi begynner med ? regne ut standardfeilen. 8 00:00:41.460 --> 00:00:43.560 Her gjelder det ? ikke f? panikk. 9 00:00:43.560 --> 00:00:46.890 Dette er litt vanskelig, men ikke s? vanskelig som det ser ut til. 10 00:00:47.560 --> 00:00:54.450 Hvis vi ser bort fra hakene og parentesene og hevet og senket skrift her s? er det egentlig bare to ukjente. 11 00:00:54.900 --> 00:00:57.960 n for antall enheter og s for standardavvik. 12 00:00:58.560 --> 00:01:01.530 Her er det alts? snakk om standardavvik s?nn som dere kjenner det fra f?r. 13 00:01:02.310 --> 00:01:11.910 De senkede tallene 1 og 2 betyr at antallet enheter eller standardavviket gjelder en av de to gruppene som det er regnet ut gjennomsnitt for - 14 00:01:12.450 --> 00:01:16.980 som kontrollgruppen eller behandlingsgruppen p? "eksperimentspr?k". 15 00:01:18.180 --> 00:01:25.140 S? vi har fire bokstaver ? sette inn tall for f?r standardfeilen kan regnes ut: n1, n2, s1,s2. 16 00:01:25.920 --> 00:01:35.880 Vi bruker eksempelet fra forelesning om sammenhengen mellom bosted - by eller land - og syn p? sentralisering som er m?lt med en sentrum-periferi-indeks der h?y verdi 17 00:01:36.000 --> 00:01:39.550 indikerer st?tte til sentralisering. 18 00:01:39.550 --> 00:01:44.290 Gjennomsnittene de trenger vi ikke enda s? vi g?r til kolonnen for standardavvik og antall enheter. 19 00:01:44.290 --> 00:01:48.060 Her har jeg satt inn bokstavene for ? vise hvilket tall som skal erstatte hvilken bokstav. 20 00:01:49.560 --> 00:01:54.990 s er standardavvik og n er enheter, men hvordan vet man hva som er 1 og 2? 21 00:01:54.990 --> 00:02:00.670 I eksperimenter s? er det den "behandlede gruppa" som er 1 og kontrollgruppen som er 2. 22 00:02:00.670 --> 00:02:10.500 Det er ikke alltid like tydelig hvem vi skal tenke p? som "behandlet" og "kontroll" i andre forskningsdesign, som i dette designet her med by og land. 23 00:02:10.800 --> 00:02:20.760 Det vil uansett ikke p?virke resultatet av hypotesetesten s? lenge du er konsekvent - s? hele raden for by her m? behandles enten som 1 eller som 24 00:02:20.760 --> 00:02:23.160 2 i formelen og ikke en blanding. 25 00:02:24.580 --> 00:02:31.660 I videoen om korrelasjon sier jeg litt mer om dette n?r jeg snakker om skalaretning og koding. 26 00:02:31.660 --> 00:02:34.270 S? nederst her har jeg satt inn tallene i formelen. 27 00:02:34.870 --> 00:02:38.710 Sett gjerne videoen p? pause, tast inn p? kalkulator og se hva du f?r. 28 00:02:39.580 --> 00:02:41.400 Fikk du 0.20? 29 00:02:41.400 --> 00:02:43.180 I s? fall, bra! 30 00:02:43.180 --> 00:02:46.990 Da har du brukt parentesene riktig, og det krever en del konsentrasjon her. 31 00:02:47.740 --> 00:02:55.720 S? dere som er trygge p? at dere f?r til dette dere kan fint hoppe over de neste minuttene, der skal jeg g? gjennom utregningen litt mer stegvis. 32 00:02:55.720 --> 00:02:57.460 Men, legg uansett merke til en ting. 33 00:02:57.940 --> 00:03:07.210 Da jeg satte inn tallene s? la jeg p? to ekstra parenteser i det f?rste uttrykket, ¨Śn rundt tallene over br?kstreken og ¨Śn rundt tallene under 34 00:03:07.270 --> 00:03:14.230 br?kstreken. Husk ? ta med disse n?r dere gj?r utregningen i en operasjon p? kalkulator, eller s? blir det kr?ll. 35 00:03:15.640 --> 00:03:24.460 Jeg skal g? gjennom utregningen stegvis, som en liten repetisjon for dem som f?ler det er en stund siden de har forholdt seg til tall og br?ker og parenteser og s?nt. 36 00:03:25.570 --> 00:03:29.980 Igjen, sett gjerne video p? pause for hvert steg og f?lg meg med din egen kalkulator. 37 00:03:31.580 --> 00:03:37.730 Som jeg viser ?verst her, s? begynner vi i det jeg kaller de innerste parentesene, og regner ut det som st?r i dem. 38 00:03:38.360 --> 00:03:43.520 Da f?r vi det som st?r p? linje to - og vi kan ta vekk de innerste parentesene. 39 00:03:43.520 --> 00:03:47.070 P? linje tre regner vi ut det som er opph?yd i andre. 40 00:03:47.070 --> 00:03:50.060 Da f?r vi det som st?r nederst. 41 00:03:50.060 --> 00:03:57.170 S? ganger vi sammen de to tallene som st?r p? hver side av plusstegnet helt ?verst. 42 00:03:57.170 --> 00:04:02.900 I linje to legger vi sammen det vi sitter igjen med og deler p? tallet under br?kstreken. 43 00:04:02.900 --> 00:04:06.620 Og da sitter vi endelig igjen med bare ett tall i hver kvadratrothake. 44 00:04:07.280 --> 00:04:10.610 Vi tar kvadratroten av hver av dem f?rst. 45 00:04:10.610 --> 00:04:12.530 S? ganger vi dem med hverandre. 46 00:04:12.530 --> 00:04:15.290 Og da har vi standard feilen 0.18. 47 00:04:16.310 --> 00:04:20.690 Noen av dere husker kanskje at jeg sa det skulle bli 0.20 n?r man gj?r det i en omgang p? kalkulator. 48 00:04:21.980 --> 00:04:26.160 Grunnen til forskjellen er at vi har gjort en del avrundinger underveis. 49 00:04:26.160 --> 00:04:28.560 S? begge svarene regner vi her som riktige. 50 00:04:29.270 --> 00:04:33.890 Men husk ? ta med minst et par desimaler underveis i utregningen for ? ikke miste for mye presisjon. 51 00:04:36.230 --> 00:04:38.470 Vi tar med oss standardfeilen videre. 52 00:04:38.470 --> 00:04:42.560 Men for ? regne ut t s? trenger vi ogs? forskjellen mellom gjennomsnittene. 53 00:04:43.340 --> 00:04:49.670 Den finner vi i kolonnen for gjennomsnitt i tabellen: 7.42 - 5.22. 54 00:04:50.090 --> 00:04:51.500 Det blir 2.2. 55 00:04:52.400 --> 00:04:56.600 Vi setter inn i formelen for t og vi f?r 12.2. 56 00:04:57.740 --> 00:05:06.830 N? trenger vi en kritisk t-verdi ? sammenligne denne observerte t-en med, for ? se om den er h?y nok til at vi kan forkaste 57 00:05:06.830 --> 00:05:10.460 nullhypotesen om at det ikke er noen sammenheng i populasjonen. 58 00:05:11.000 --> 00:05:14.960 Hvis vi kan forkaste nullhypotesen s? kan vi konkludere med at sammenhengen er statistisk signifikant. 59 00:05:17.230 --> 00:05:26.260 For ? lese kritisk t-verdi ut av t-tabellen s? m? vi vite to ting: antall frihetsgrader, degreesof freedom p? engelsk, og 60 00:05:26.260 --> 00:05:27.640 signifikansniv? p. 61 00:05:28.000 --> 00:05:37.520 Frihetsgrader handler om hvor mye informasjon eller data vi har utover det minimum vi trenger for ? gj?re en bestemt statistisk operasjon. 62 00:05:37.520 --> 00:05:40.510 Det regnes ut med ulike formler i de ulike hypotesetestene. 63 00:05:41.020 --> 00:05:45.700 I denne testen s? legger vi sammen antall enheter og trekker fra 2. 64 00:05:45.700 --> 00:05:48.250 1359 + 447 - 2. 65 00:05:50.500 --> 00:05:52.360 S? velger vi signifikansniv?. 66 00:05:52.360 --> 00:05:57.250 Vi velger det vanligste 5%, alts? p = 0.05. 67 00:05:58.000 --> 00:06:07.540 S? det vi sier med det er at 5 prosent er den maksimale sannsynligheten vi er villig til ? akseptere for at vi p?viser en falsk sammenheng eller 68 00:06:07.540 --> 00:06:09.850 forkaster en sann nullhypotese. 69 00:06:10.180 --> 00:06:19.300 Det vil ogs? si konkludere med at sammenhengen i utvalget v?rt finnes i populasjonen n?r den egentlig ikke gj?r det. 70 00:06:19.300 --> 00:06:26.230 Med frihetsgrader godt over tusen og p = 0.05 s? finner vi kritisk verdi 1.96 i t-tabellen. 71 00:06:27.970 --> 00:06:29.740 Denne verdien gjelder for det som heter en to-halet hypotesetest. 72 00:06:33.220 --> 00:06:36.450 Hva en en-halet hypotesetest er og n?r vi bruker det forklarer jeg i en annen video. 73 00:06:37.780 --> 00:06:39.130 S? endelig har vi alt vi trenger. 74 00:06:39.580 --> 00:06:46.120 Vi sammenligner testobservatoren, observert t, med kritisk verdi for t. 75 00:06:46.120 --> 00:06:56.110 Og siden t p? observert t p? 12,2 er st?rre enn terskelen p? 1.96, kritisk verdi 76 00:06:56.110 --> 00:07:05.080 for t, er sammenhengen, eller korrelasjon, mellom bosted og sentrum-periferi-indeksen signifikant p? 5 %-niv? 77 00:07:06.430 --> 00:07:10.990 . Alts? trolig skyldes sammenhengen vi fant i utvalget ikke bare tilfeldigheter. 78 00:07:11.650 --> 00:07:14.800 Trolig finnes den ogs? i populasjonen. 79 00:07:14.800 --> 00:07:21.280 Til slutt s? m? vi huske, som alltid, at p-verdier er en viktig del av en analyse, men de m? ikke tolkes alene. 80 00:07:21.730 --> 00:07:26.590 Det er for tidlig n? ? si at ? bo i byen f?rer til positivt syn p? sentralisering. 81 00:07:27.070 --> 00:07:32.300 Vi m? tenke f?rst gjennom de tre andre testene for ?rsakssammenheng fra Kellstedt og Whitten. 82 00:07:32.300 --> 00:07:39.310 S? m? vi vurdere om sammenhengen er sterk nok til at den er av substansiell interesse. 83 00:07:39.310 --> 00:07:48.310 Og ikke minst om forskningsdesignet som ligger bak er solid nok, f?r vi kan konkludere med at dette funnet gir st?tte til teorien vi startet med.