Institusjonelle dataarkiv


Institusjonen bør ha en viss oversikt over hvilke arkivløsninger som finnes for norske forskere, og om det er hensiktsmessig å tilby et eget institusjonsarkiv for åpne forskningsdata.

Et åpent tverrfaglig institusjonsarkiv er et godt alternativ til fagspesifikke arkiv og andre arkiv som dekker helt særskilte behov, slik som løsninger for sensitive data. I denne artikkelen presenteres de to mest aktuelle institusjonsarkivene for den norske UH-sektoren. Det finnes en rekke tverrfaglige arkiv som alle kan benytte seg av, også uavhengige forskere, men det kan være hensiktsmessig at institusjonen har et eget institusjonsarkiv for sine forskere. Et institusjonsarkiv kan legge til rette for god forvaltning og kuratering av datasett, som ikke er avhengig av enkeltforskere. I tabellen under er det gjort et forsøk på å oppsummere og sammenligne viktige funksjoner i de to mest aktuelle løsningene for forskere i Norge; DataverseNO og Figshare.

Det er også verdt å merke seg at Unit/Sikt har et tverrfaglig dataarkiv, BIRD, som en av sine konsortietjenester. I forbindelse med utviklingen av et nasjonalt vitenarkiv (NVA) vurderes det om dette skal ha en dataarkiveringskomponent. BIRD vil da opphøre som et separat tjeneste og integreres i NVA, og det er derfor ikke aktuelt for nye institusjoner å ta i bruk  BIRD nå.

Se også informasjonsartikkelen Arkivering og publisering av data for informasjon om arkivløsninger som ivaretar sensitive data eller egne fagområder

  Figshare DataverseNO
Åpen kilde Nei. Ja.
Kostnadsmodell Kommersiell tjeneste - prisen er institusjonsavhengig. Partnerinstitusjoner betaler en årlig kostnad som inkluderer opplæring, kuratering, og brukerstøtte. Forskere fra andre norske institusjoner kan benytte arkivet gratis.
Lisenser CC0 (public domain) for datasett, evt. CC BY for andre objekter (publikasjoner). CC0 er standard. Ved behov for eller ønske om, å bruke en annen lisens, ta kontakt med støttetjenesten.
Egnet for sensitive data. Ja, men ikke anbefalt. Nei, men støtter begrenset adgang.
Versjonskontroll Ja. Ja.
Størrelse på fil/datasett Vanlig grense er 5GB per fil. Institusjonskontoer har egne grenser, og en kan laste opp større filer, men maks. filstørrelse er 5TB. Maks filstørrelse 5GB. Størrelsen på hele datasettet bør ikke overskride 50 GB, kontakt støttetjenesten ved behov for mer plass.

Kan lenke fra datasett til artikkel

Ja. Ja.
Virusskanning Nei. Nei.
Langtidsarkivering/
mellomlagring
Begge deler. Begge deler (men  målet er å publisere).

DOI (persistent identifikator) på datasett

Ja. Ja.
Indeksert i søkemotor for datasett Ja, alle store, inkl. BASE, Google dataset search. Ja, alle store, inkl. BASE, Google dataset search
Kontrollert vokabular Australian and New Zealand Standard Research Classification. Dataverse custom vocabulary.
Liste over foretrukne filtyper Ja (alle filtyper). Ja (alle filtyper). Zip-filer pakkes ut automatisk.
Sertifisering På vei mot ISO27001-sertifisering. ISO27001 omhandler informasjonssikkerhet. CoreTrustSeal. CTS stiller også krav til selve dataene.
Andre kommentarer I Norge brukes Figshare kun av USN, internasjonalt av mange flere. Kan også brukes til andre forskningsobjekter (f.eks. artikler).

UiT administrerer for andre universitet, på server i Norge. De tilbyr en tjeneste som inkluderer opplæring og drift.

 

Tekst: Open Science Toolbox/Sikt


Share: Share to LinkedIn Share to Facebook Share by mail Share to Twitter