Institusjonelle dataarkiv
Et åpent tverrfaglig institusjonsarkiv er et godt alternativ til fagspesifikke arkiv og andre arkiv som dekker helt særskilte behov, slik som løsninger for sensitive data. I denne artikkelen presenteres de to mest aktuelle institusjonsarkivene for den norske UH-sektoren. Det finnes en rekke tverrfaglige arkiv som alle kan benytte seg av, også uavhengige forskere, men det kan være hensiktsmessig at institusjonen har et eget institusjonsarkiv for sine forskere. Et institusjonsarkiv kan legge til rette for god forvaltning og kuratering av datasett, som ikke er avhengig av enkeltforskere. I tabellen under er det gjort et forsøk på å oppsummere og sammenligne viktige funksjoner i de to mest aktuelle løsningene for forskere i Norge; DataverseNO og Figshare.
Det er også verdt å merke seg at Unit/Sikt har et tverrfaglig dataarkiv, BIRD, som en av sine konsortietjenester. I forbindelse med utviklingen av et nasjonalt vitenarkiv (NVA) vurderes det om dette skal ha en dataarkiveringskomponent. BIRD vil da opphøre som et separat tjeneste og integreres i NVA, og det er derfor ikke aktuelt for nye institusjoner å ta i bruk BIRD nå.
Se også informasjonsartikkelen Arkivering og publisering av data for informasjon om arkivløsninger som ivaretar sensitive data eller egne fagområder.
Figshare | DataverseNO | |
Åpen kilde | Nei. | Ja. |
Kostnadsmodell | Kommersiell tjeneste - prisen er institusjonsavhengig. | Partnerinstitusjoner betaler en årlig kostnad som inkluderer opplæring, kuratering, og brukerstøtte. Forskere fra andre norske institusjoner kan benytte arkivet gratis. |
Lisenser | CC0 (public domain) for datasett, evt. CC BY for andre objekter (publikasjoner). | CC0 er standard. Ved behov for eller ønske om, å bruke en annen lisens, ta kontakt med støttetjenesten. |
Egnet for sensitive data. | Ja, men ikke anbefalt. | Nei, men støtter begrenset adgang. |
Versjonskontroll | Ja. | Ja. |
Størrelse på fil/datasett | Vanlig grense er 5GB per fil. Institusjonskontoer har egne grenser, og en kan laste opp større filer, men maks. filstørrelse er 5TB. | Maks filstørrelse 5GB. Størrelsen på hele datasettet bør ikke overskride 50 GB, kontakt støttetjenesten ved behov for mer plass. |
Kan lenke fra datasett til artikkel |
Ja. | Ja. |
Virusskanning | Nei. | Nei. |
Langtidsarkivering/ mellomlagring |
Begge deler. | Begge deler (men målet er å publisere). |
DOI (persistent identifikator) på datasett |
Ja. | Ja. |
Indeksert i søkemotor for datasett | Ja, alle store, inkl. BASE, Google dataset search. | Ja, alle store, inkl. BASE, Google dataset search |
Kontrollert vokabular | Australian and New Zealand Standard Research Classification. | Dataverse custom vocabulary. |
Liste over foretrukne filtyper | Ja (alle filtyper). | Ja (alle filtyper). Zip-filer pakkes ut automatisk. |
Sertifisering | På vei mot ISO27001-sertifisering. ISO27001 omhandler informasjonssikkerhet. | CoreTrustSeal. CTS stiller også krav til selve dataene. |
Andre kommentarer | I Norge brukes Figshare kun av USN, internasjonalt av mange flere. Kan også brukes til andre forskningsobjekter (f.eks. artikler). |
UiT administrerer for andre universitet, på server i Norge. De tilbyr en tjeneste som inkluderer opplæring og drift. |
Tekst: Open Science Toolbox/Sikt