Dokumentasjon av NIB


Dokumentasjonen på disse sidene dekker en oversikt over NIB-systemet og de enkelte basene og hvordan de er organisert. Dokumentasjonen dekker også hvilke indikatorer som blir bygd i hver base.

Dokumentasjonen er delt inn i følgende sider:

Generelt om basene

NIB inneholder to hovedkilder: WoS og OpenAlex, som begge ligger i en postgresql-database på en egen server. (Se base-oversikt fra pgadmin under). 
Hver kilde-base kan forekomme i tre hoved versjoner:

  1. Produksjon, stabil versjon hvor evt endringer i datamodell o.l. meldes i god tid. Disse navngis med _prod.
  2. Test – Dette er versjoner som i utgangspunktet er relativt stabile, men hvor det kan forekomme små og store endringer på kort varsel. Navngis med _testNN (feks wos_test01).
  3. Development/utvikling – Dev baser er først og fremst kortlivede og/eller ustabile, hvor endringer ikke nødvendigvis varsles på forhånd. Navngis med _devNN (feks wos_dev01).
Baser i NIB

Per i dag er det kun WoS som er satt i 'prod'-versjon, det er enda ingen prod-versjon av OpenAlex. Dette skyldes at datamodellen, indikatorer, osv. fortsatt er under utvikling og testing.
Avhengig av hvilke rettigheter en bruker har, så har man tilgang til enten begge baser (alle versjoner) eller kun OpenAlex.

Oppdatering av datagrunnlag

Datagrunnlaget i begge basene oppdateres månedlig, hvorpå antall siterings- og indikatorberegninger vil endre seg. Informasjon om oppdatering av basen vil legges ut i drifts- og endringsloggen samt informeres om i bibliometriforum.

NIB har ikke kapasitet til å vedlikeholde eldre versjoner av basene. Det er derfor viktig at datasett som lastes ned for analyse blir tatt vare på lokalt, i tilfelle det oppstår behov for å rekonstruere analyser.

Tilgang til data

Direkte tilgang til NIB-data skjer pr i dag via PostgreSQL, og er derfor adgangsregulert. Dersom man har behov for slik tilgang, finner man søknadsskjema her

Matching og synkronisering med NVA

Nasjonalt vitenarkiv (NVA) er en nasjonal tjeneste for lagring, tilgjengeliggjøring av forskningsresultater og vitenskapelige publikasjoner. Tjenesten legger til rette for åpen tilgang til forskning, i tråd med nasjonale retningslinjer og er arvtager til tidligere Cristin og Brage-arkivene (institusjonelle vitenarkiv).

En av nøklene til bedre bibliometriske analyser ligger i skjæringspunktet mellom NVA og NIB, da NIB kan supplere NVA med bibliometrisk informasjon som ellers ikke er tilgjengelig i NVA. Andre veien kan NVA brukes til å berike bibliografiske databaser som tradisjonelt har et svakt datagrunnlag på institusjoner og forfatteradresser. Her har NVA forholdsvis god kontroll på norske institusjoner i UH-, helse og instituttsektor. Det betyr at det ligger til rette for mer presise avgrensninger av publikasjons-delmengder på institusjonsnivå enn det datagrunnlaget i WoS og OpenAlex støtter. Per i dag er det kun NVA/Cristin-poster fra og med 2011 og nyere som blir matchet med korresponderende poster i WoS og OpenAlex. Dette utgjør anslagsvis rundt 300 000 poster i hver database. Ikke alle poster i NVA vil kunne matches, antall poster som er matchet vil derfor variere noe mellom basene. Matching skjer primært på doi, men vil bli utvidet med andre heuristiske rutiner som også matcher på tittel, tidsskrift og forfattere etc.

DUCT

Matchede data kan hentes ut på to måter: enten via SQL-spørringer direkte i basen, eller via DUCT-systemet. DUCT er en tjeneste som leveres av NVA og som har med et utvalg felter fra NIB. Per i dag er det kun data fra WoS som kan hentes ut i DUCT. Merk at SQL-spørringer ikke gir tilgang til NVA-data utover en koblingsnøkkel. For å få et komplett datasett må NVA-data da hentes fra API eller andre steder. 


Del: Share to LinkedIn Share by mail