English version of this page

Dataorganisering

God organisering av data f?rer til bedre effektivisering og reproduserbarhet.  

En god organisering av forskningsprosjektet gj?r at man sparer tid, ?ker sjansen for reproduserbarhet og gj?r det enklere ? dele data.    

Hvordan forskningsprosjektet skal organiseres avhenger av ulike faktorer. God organisering kjennetegnes bl.a. ved:  

  • En gjennomtenkt mappestruktur der det er enkelt ? finne filer 

  • B?rekraftige filformater som har varighet og kan benyttes uavhengig av spesifikke programvarer 

  • Prosjektet benytter seg av navnekonvensjoner for filer, som i sin tur gj?r filene forst?elige 

  • Detaljert informasjon om datainnsamlingen og prosesseringsprosedyrer (se Metadata og dokumentasjon) 

  • En README-fil eller lignende som beskriver organiseringen (se Metadata og dokumentasjon)  

Mappestruktur 

Det er viktig ? strukturere dataene i mapper, slik at det blir enklere ? lokalisere og organisere filene, og man har bedre kontroll p? ulike versjoner av filer. En gjennomtenkt mappestruktur er spesielt viktig i tilfeller der man 亚博娱乐官网_亚博pt手机客户端登录er med andre. Mappestrukturen har stor innvirkning p? hvordan filene kan prosesseres og analyseres. Straks en struktur fylles med data kan det v?re b?de tungvint og tidkrevende ? endre p? noe. Her er noen tips: 

  • Ikke bruk desktop som lagringsplass 

  • Lag et mappehierarki og bruk beskrivende mappenavn 

  • Unng? ? lage for generelle mapper, og lag heller flere undermappper 

  • Lag en struktur og hold deg til den 

  • Tenk systematisk, logisk og klart f?r du begynner (!) 

  • Det skal v?re raskt og effektivt ? navigere 

  • Det skal v?re enkelt ? bruke til enhver tid 

  • Skalerbar struktur 

  • Hold aktive data fraskilt fra ferdige data 

  • Foreta en opprydning med jevne mellomrom 

Du kan finne et eksempel p? en systematisk, enkel og skalerbar mappestruktur p? nettsidene til CodeRefinery. Et annet nedlastbart eksempel finnes her.  

Filformater

P? et tidlig tidspunkt i forskningsprosessen er det spesielt viktig ? tenke p? hvilket filformat du skal bruke p? dataene dine. En viktig del av prosjektets metadata og dokumentasjon kan skrives inn i datafilen. Et eksempel er n?r du tar et bilde med mobiltelefonen og informasjon om dato og tidspunkt f?lger med bildefilen (dvs. metadata). Denne type informasjon kan fremme dataanalyse, dokumentasjon, og reproduserbarhet.  

For ? sikre at dataene er tilgjengelige i et langtidsperspektiv, er det en god idé ? lagre dataene (eller kopier av disse) i b?rekraftige filformat. En plain text-fil (.txt) er mer b?rekraftig enn en Microsoft Word-fil (.docx), ettersom den f?rste er ?pen, ikke produsenteid og ofte brukt.  

Her kan du finne mer informasjon om b?rekraftige filformater:  

Navnekonvensjoner for filer

En filnavnkonvensjon er regler for hvordan filer skal navngis i forskningsprosjektet ditt. Det er tidsbesparende ? bruke n?r man skal finne igjen spesifikke filer. I tillegg gj?r det det enklere ? gjenbruke og reprodusere filen.  

Her er oversikt over noe du kan inkludere i et filnavn:  

  • Dato og tidspunkt som er relevante for filens innhold 

  • Navn p? prosjekt eller eksperiment 

  • Versjonsnummer p? filen 

  • Kort informasjon om innholdet i filen 

  • Navn eller initialer p? forsker 

  • Unik identifikator som nummer p? eksperiment eller en serie 

N?r du gir navn til en fil, er det best praksis ?:  

  • Bruke korte og beskrivende navn 

  • Gi generell informasjon f?r mer spesifikke detaljer  

  • Bruke understrek for ? skille ord 

  • Skrive dato baklengs (????MMDD) – ISO 8601 standard 

  • Skrive nummer med likt antall tall:  

  • Skriv 01, ikke 1, hvis tallene g?r lengre enn til 10 

  • Skriv 0001, ikke 1, hvis tallene g?r lengre enn til 1000 

  • Skrive versjonsnummer til slutt 

  • Unng? bruk av spesielle tegn:  

  • #, %, &, \ , / , ‘ , “ , !, $ , > , < , { , } , * , ?, =? 

  • IKKE bruke mellomrom i filnavn 

  • IKKE la navnet begynne eller slutte med mellomrom, punktum, bindestrek, eller understrek 

  • Alltid bruke sm? bokstaver (de fleste systemer er sensitive for store og sm? bokstaver

Lurer du p? noe?

Send gjerne en epost til: research-data@uio.no 

 

 

Emneord: data, organisering, filnavn, filstruktur, mappestruktur
Publisert 16. juni 2022 08:21 - Sist endret 12. apr. 2023 10:06