Tjenesteartikkel: Innsamling og lagring av forskningsdata


Tema for denne artikkelen er støttetjenester for den aktive delen av datahåndteringen, det vil si fra og med innsamling og fram til datasettet er klart for arkivering og eventuell publisering.

Viktige momenter er datainnsamling, tilgjengelige lagringsløsninger, informasjonssikkerhet og verktøy for samhandling og deling.

Merk at «lagring» viser til data som er i aktivt bruk, mens langtidsbevaring av ferdige data i et egnet dataarkiv betegnes som «arkivering».

Se også artikkel om innsamling og lagring under temaartiklene om Forskningsdata.

 

Datainnsamling

Det er viktig å kunne støtte god dataflyt gjennom hele den aktive forskningsprosessen, og dette inkluderer også innsamling og generering av data. Data er ofte sårbare når de flyttes mellom ulike enheter, og det er nødvendig med gode systemer for innsamling og overføring. Hvis det er snakk om sensitive data, stilles det ekstra krav til sikkerhet og forsvarlig håndtering. Det kreves derfor god oversikt over hva institusjonen tilbyr av løsninger for sikker innsamling av personopplysninger, og det kan være nyttig å utarbeide en guide for forskere og studenter.

Eksempel på innsamlingsguide for persondata fra NTNU, som er utviklet av støttetjenesten Research Data @NTNU.

Valg av verktøy og løsninger for lagring

Bibliotekets støttetjenester for lagring av forskningsdata er naturlig nok nært knyttet til hva institusjonen tilbyr av lagringsløsninger og verktøy. Det er derfor viktig å skaffe oversikt over de aktuelle lagringsløsningene ved institusjonen, vite hvilke behov de dekker, og avklare hvorvidt det er åpenbare mangler med tanke på krav og retningslinjer. IT-avdelingen er en naturlig samarbeidspartner i denne prosessen.  

Noen institusjoner kan ha spesialtilpassete lagrings- og samhandlingssystemer som støtter og dokumenterer dataflyt gjennom hele prosjektet, fra innsamling til arkivering/publisering, mens andre kun tilbyr standardløsninger.

Hvis det ikke eksisterer allerede, kan det være nyttig å utarbeide en lagringsguide som gir informasjon til forskere om hvilke lagringsløsninger som kan brukes for ulike typer data. Her er det også viktig med god informasjon om informasjonsklassifisering, slik at forskere klassifiserer dataene sine riktig.

Eksempel: Lagringsguide fra NTNU

 

Verktøy

I tabellen nedenfor listes det opp noen eksempler på verktøy for håndtering og lagring av data:

Navn på tjenesten Kort om tjenesten Hvem kan få tilgang? Hvilke datatyper og formater støttes? Kostnader
Tjenester for sensitive data (TSD) – UiO i partnerskap med Sigma2 Lagring og sikre tjenester for analyse av sensitive data Forskere ved institusjoner som har en avtale om bruk med UiO Tjenesten er godkjent for opptil sorte data (ved UiO) Tjenesten har ulike modeller avhengig av hvilken institusjon forskeren tilhører
Educloud Research - UiO Lagring og sikkert skrivebord for opptil røde data Kan brukes av forskere ved institusjoner i UH-sektoren som har en avtale om bruk med UiO Tjenesten er godkjent for opptil røde data (ved UiO) Tjenesten har ulike modeller avhengig av hvilken institusjon forskerne tilhører
NIRD Data Storage og Service Platform – Sigma2 Lagring og analyse av store datamengder Forskere søker om tilgang. Søknadene behandles to ganger i året Tjenesten er laget for å håndtere store mengder data (over 10 TB)

Tjenesten har en «user contribution model» og prisene avhenger av type prosjekt og mengde data som lagres

 

Utfordringer ved aktiv lagring

I praksis er det som regel et begrenset utvalg lagringsmuligheter. Dette gjelder særlig for konfidensielle data som må sikres mot innsyn, men som samtidig skal være tilgjengelige for prosjektmedlemmer og samarbeidspartnere. Utfordringer  kan også oppstå også når det er snakk om store datamengder. Ofte tilbyr institusjonene bare en begrenset mengde lagringskapasitet per prosjekt, og dersom dette er tilfellet, er det viktig å ha avklart alternative lagringsmuligheter i forkant dersom datamengdene er store. Kan institusjonen tilby større kapasitet ved behov? Koster dette ekstra? Hvilke eksterne løsninger er tilgjengelige, og hva er kostnaden for disse?

Når det er snakk om konfidensielle data, ligger utfordringen ofte i å finne løsninger som er sikre nok samtidig som de gjør det mulig å arbeide med dataene og dele dem med eventuelle samarbeidspartnere. Det kan også være en ekstra utfordring når studenter deltar i eller gjennomfører prosjekter, da de ofte kun har tilgang til privat utstyr. Hvis ikke institusjonen selv dekker behovet for sikre lagrings- og samhandlingsløsninger, må slike tjenester enten utvikles eller anskaffes, eller en må bruke eksterne tjenester. Et eksempel på en slik ekstern tjeneste er UiOs Tjenester for sensitive data (TSD), som dekker innsamling av data, analyse, behandling og lagring i sikrede omgivelser.

 

 

Bibliotekets tilbud

Organisering og samarbeidspartnere

Nivå 1

Biblioteket er kontaktpunkt og kan vise til egne og eksterne nettressurser for informasjon og regelverk om datainnsamling

Nettbasert informasjon om metadata, klassifisering av data, organisering av filer

Innsamlingsguide

Lagringsguide

Webredaktør/webansvarlig ved institusjonen. IT-avdeling (lagringsguide)
Nivå 2

Veiledning og anbefaling av ulike verktøy til bruk i datainnsamling

Opplæring i bruk av enkle verktøy (f.eks. diktafoner, nettbaserte verktøy)

Veiledning om klassifisering og valg av lagrings- og samhandlingsløsninger

 

IT-avdeling
Nivå 3

Katalog over prosjekter og data ved institusjonen

Fagspesifikk veiledning om metoder for datainnsamling (e.g., text mining, verktøy for innsamling av lyd og bilde, spørreskjema)

Fagspesifikk veiledning om aktuelle lagringsmuligheter

IT-avdeling, forskningsadministrasjon

 

Et eksempel på god praksis er Research Data @NTNU.

 

Tekst: Open Science Toolbox/Unit


Del: Share to LinkedIn Share to Facebook Share by mail Share to Twitter