Søk etter og gjenbruk data


Det finst ei rekke dataarkiv (data repositories) som gir tilgang til ulike typar kjeldedata og forskingsdata.

Ved prosjektstart og utarbeiding av ein datahandteringsplan kan det vere hensiktsmessig å undersøke kva som allereie eksisterer av relevante data som eventuelt kan gjenbrukast. I tillegg bidrar dette til at innsamling av nye data kan gjerast på ein slik måte at dataa blir standardiserte og samanliknbare.

Institusjonelle vitenarkiv gir open tilgang til publikasjonar som artiklar og avhandlingar. Dataarkiv sørger for tilgang til dataa som underbygger forskinga. I dataarkiva er det ofte lenka til den publikasjonen dataa underbygger, anten det er hos eit tidsskrift eller eit vitenarkiv. Andre aktuelle data av interesse for forsking er offentlege data, register og helsedata. Dette inkluderer både heilt opent tilgjengelege data eller data som er tilgjengelege etter søknad.

 

Brukslisensar og datasitering

Opent tilgjengelege datasett publiserast ofte med ein Creative Commons-lisens eller andre brukslisensar (sjå også Lisensiering av forskningsdata), slik at ein enkelt kan sjå kva ein har løyve til med tanke på gjenbruk. For nokre typar data, for eksempel helseregisterdata, må ein som forskar ofte søke om tilgang til og oppfylle spesifikke vilkår før ein kan få dataa utlevert.

Ved gjenbruk av datasett i forskning er det viktig å oppgje kjelda til dataa, og sitere dette riktig i publikasjonar. Dette er et grunnleggande forskingsetisk prinsipp som gjeld uavhengig av kva for formell og juridisk lisens datasettet har vorte publisert med. Datasiteringar er viktige for å anerkjenne og synleggjere bidrag, og datasett vil i aukande grad reknast som ein del av den vitskapelege produksjonen som blir merittert. DataCite har anbefalingar og eksempel på korleis data som blir gjenbrukt kan siterast i vitskapelege artiklar.

 

Databasar for datasøk

Det finst eigne søkemotorer som haustar frå fleire ulike kjelder:

  • Bielefeld Academic Search Engine (BASE). Denne søkemotoren er ikkje berre for datasett, men også andre typar forskingsresultat og akademiske ressursar, inkludert artiklar, avhandlingar, patent, undervisningsmateriell osv. Det er mogleg å avgrense på datasett ved å gå inn i avansert søk.
  • DataCite er ein organisasjon som utsteder persistente identifikatorar (DOI) for datasett, og som også har moglegheiter for søk etter data.
  • Google Dataset Search er Googles eigen søkemotor for datasett.
  • Elsevier Data Search/Mendeley Data Search er ein søkemotor som haustar fleire arkiv.
  • re3data er eit metaarkiv/register over dataarkiv kor ein kan søke etter eigna arkiv innanfor ein region eller ein disiplin.

 

 Nasjonale datakjelder og ressursar

  • Sikt har blant anna eit nasjonalt arkiv med mange datasamlingar som er tilgjengeleg for forskarar.
  • Microdata.no er ei teneste som skal gjere det enklare å få tilgang til SSBs registerdata for bruk i forsking. Tenesta har innebygt personvern ved hjelp av ein anonymiseringsmodell, slik at forskarar ikkje behøver å søke om tilgang til de underliggande dataa. Forskarar og studentar ved institusjonar som har teikna avtale kan få tilgang.
  • helsedata.no er det oversikt over ulike typar helsedata og register og informasjon om korleis ein kan få tilgang til desse.
  • Felles datakatalog er ein oversikt over tilgjengelege offentlege data.

 

Tekst: Open Science Toolbox/Sikt


Share: Share to LinkedIn Share to Facebook Share by mail Share to Twitter