Introduksjon til forskingsdatahandtering


God forskingsdatahandtering (Research Data Management, RDM) er ein føresetnad for at data skal vere mogleg å forstå og gjenbruke. Også data som ikkje skal publiserast opent må handterast forsvarleg med tanke på etterprøvbarheit og transparens.

Kva er forskingsdata?

Alle registreringar, nedteikningar, kjelder eller rapporteringar som samlast systematisk i samband med eit forskingsprosjekt kan sjåast på som forskingsdata. Det kan vere svar frå spørjeskjema, intervjuopptak, transkripsjonar, målingar, prøver, bilde, video, observasjonar, modellar, simuleringar eller eksperiment og statistiske analysar som brukast for å svare på eit forskingsspørsmål. Samanstilling av eksisterande data (kjeldedata) er òg ein del av dette. Analyseskript, algoritmar, kode og programvare kan også inkluderast som ein type forskingsdata eller forskingsresultat. Om ein ser algoritmar, kode og programvare som ein annan type forskingsresultat som separat frå data, vil det likevel vere mange av dei same prinsippa og vurderingane knytt til forvaltning, deling og publisering av desse, men med nokre andre omsyn og praksis (sjå også artikkelen om Åpen kjeldekode). 

 

Forskingsdatasyklusen

Forskingsdatasyklusen er eit nyttig verktøy for å visualisere prosessen med handtering av forskingsdata. Her framstillast forskingsprosessen gjennom ulike fasar, og denne kan vere eit hjelpemiddel for å sjå heilskapleg på og planlegge datahandtering og dei ulike stega som kan inngå i eit forskingsprosjekt. Dette kan for eksempel vere i forbindelse med utarbeiding av ein datahandteringsplan, kor det kan vere til hjelp for å sjå på dataflyt og tilhøve mellom de ulike fasane av forskingsprosjektet.  

Syklusen begynner gjerne med at ein planlegg eit nytt prosjekt, tenker over korleis ein kan samle inn nye data (resultatdata) eller søke etter eksisterande data (kjeldedata) til bruk i prosjektet, og opprettar ein datahandteringsplan ut frå dette. Deretter kjem den aktive fasen med innsamling, analyse og lagring av data, som kan gå føre seg i fleire rundar eller fasar. Avslutningsfasen inneber arkivering (langtidslagring) av ferdige datasett, og gjerne open publisering av data på same måte som ein publiserer artiklar. Når dei opne dataa har vorte publisert vil dei kunne bli kjeldedata for andre som skal i gang med eit prosjekt. 

For bibliotek og andre støttetenester kan ein datahandteringsplan også brukast for å vurdere og planlegge kva for infrastruktur og støttetenester som bør tilbydast til forskarar (og studentar), for å gi gjennomgåande støtte under heile syklusen, og korleis ulike system og verktøy skal samhandle. Denne syklusen er ein overordna, forenkla og idealisert versjon av korleis forskingsprosessen gjerne går føre seg, og det vil vere stor variasjon i korleis ulike typar fagfelt og prosjekt gjennomfører datahandtering. Samtidig er det ein del generelle trekk som vil vere felles og nødvendig for alle prosjekt (og institusjonar) som ønsker forsvarleg forvaltning av data.

 

Illustrasjonen er henta frå universitetsbiblioteket ved UC Santa Cruz i California, tilgjengeleg under CC BY-NC-lisens.

 

Tekst: Open Science Toolbox/Unit


Share: Share to LinkedIn Share to Facebook Share by mail Share to Twitter