Innsamling og lagring av forskningsdata



Prosessen frå innsamling av data og fram til datasettet arkiverast utgjer den aktive delen av forskingsdatahandteringa. Flytting og mellomlagring er punkt som ofte blir gløymt og som kan gjere data sårbare, og det er viktig at forskarar har god oversikt over dataflyten gjennom heile forskingsprosessen.

Innsamling av data

Ved innsamling av data gjeld dei same omsyna som for resten av den aktive datahandteringa. Data må sikrast mot tap og øydelegging, og viss det er snakk om personopplysningar eller andre former for sensitive og konfidensielle data, må dei også skjermast mot innsyn under innsamling og overføring til lagringsområdet. Her er det viktig å tenke heilskapleg, slik at data ikkje lagrast på usikre einingar eller at det lagast kopiar ingen har oversikt over. Institusjonen bør ha på plass gode rutinar på alle nivå for å sørge for at dataa blir organisert på ein god måte og at krav til sikkerheit blir ivaretatt. Relevante metadata og dokumentasjon må også samlast inn og strukturerast på ein god måte, slik at all nødvendig informasjon for å forstå og bruke dataa i framtida er tilgjengeleg. 

Aktiv lagring

Det er vanleg å skilje mellom det som gjerne kallast aktiv lagring og arkivering, der førstnemnde viser til lagringa av data som er i bruk (i laupet av prosjektperioden). Dette omfattar med andre ord all lagring fram til analysar og anna arbeid er avslutta og dataa arkiverast og eventuelt publiserast. Aktiv lagring heng derfor nøye saman med organisering av data og datahandteringsplan

Når ein skal velje lagringsløysing er det særleg tre faktorar som er avgjerande: konfidensialitet, integritet og tilgjengelegheit (KIT). Konfidensialitet viser til sikring mot urettmessig innsyn og tilgang. For å finne riktig grad av konfidensialitet, skal det alltid gjerast ei klassifisering av dataa. I tillegg kjem spørsmål om integritet og tilgjengelegheit. Kor viktig er det at dataa blir beskytta frå uautoriserte endringar og øydelegging? Kor viktig er det at dei er tilgjengelege heile tida? Svara på desse spørsmåla avgjer kva for lagringsløysingar som er aktuelle. Lagring av viktige forskingsdata på private datamaskiner og usikra minnepinnar som lett forsvinn, bør unngåast. Dei fleste forskingsinstitusjonar har ei IT-avdeling som tilbyr ulike typar lagringsløysingar og system som dekker ulike behov for skjerming, tilgang og backup. 

Samhandlingsløysingar

I mange tilfelle er det aktuelt å dele data og andre typar resultat og dokument med eksterne samarbeidspartnarar eller andre undervegs i eit prosjekt. Eksempel på slike verktøy og tenester som er mykje brukt, både i og utanfor forskingsmiljø, er OneDrive, Dropbox og Google drive. Det er likevel ikkje alle system som er eigna for alle typar data, og særleg konfidensielle data stiller ofte høgare krav til sikkerheit enn dei vanlegaste systema for samhandling tilfredsstiller. Mange institusjonar utviklar derfor eigne sikre lagringsområde med eigen tilgangsstyring. Ei anna mogleg løysing inneber kryptering av dataa før dei delast. Som med lagringsløysingar generelt, det å bruke løysingar som blir tilbydd eller anbefalt av institusjonens si IT-avdeling ofte et godt val for å ivareta og sikre god forvaltning av forskingsdataa.

Eit godt eksempel er USIT (Universitetets senter for informasjonsteknologi) ved UiO, som tilbyr ei rekke ulike løysingar for lagring og samhandling.

Ei flott plattform for samhandling og open forsking i praksis, er OSF (Open Science Framework). Her kan forskarar samarbeide om prosjekt, og enkelt publisere opent resultat og materiale.

 

Tekst: Open Science Toolbox/Unit

Referanser


Del: Share to LinkedIn Share to Facebook Share by mail Share to Twitter