Datamodell - OpenAlex


OpenAlex er en åpen og gratis bibliografisk database med over 270 mill. poster som organiserer vitenskapelig informasjon, inkludert publikasjoner, forfattere, institusjoner, fagområder og emner.
Tjenesten tilbyr et rikt datasett for å utforske koblinger mellom forskningsartikler, siteringer og konsepter/topics.

Klikk her for å laste ned diagrammet over.

Generelt om OpenAlex

OpenAlex har foreløpig status som 'test' i NIB-systemet og vil beholde statusen inntil den også inneholder beregnede indikatorer. OpenAlex-data leveres med ferdige installasjonsskript som installerer en forholdsvis ren versjon av basen, uten genererte indikatorer eller annet enn rå siteringstall. Det er derfor behov for noe tilpassing av basen før den kan utnyttes fullt ut, og dermed vil få status som produksjonsklar.

Indikatorer i OpenAlex

Arbeidet med indikatorer skjer kontinuerlig, og de foreløpige resultatene legges som tabeller eller "materialized views" i skjema nib_views. Foreløpig finnes testtabeller over normaliserte verdier og prosentiler basert på sub_field i topics-systemet, samt siteringsopptellinger, primært treårs-vindu. Data er foreløpig ikke en del av DUCT og kan kun hentes direkte fra basen via SQL.

Liste over de viktigste tabellene

For en full oversikt over datamodellen, se OpenAlex sin dokumentasjon

OpenAlex organiserer data i flere tabeller som representerer de ulike elementene i den bibliografiske databasen. Her er en liste over de viktigste tabellene i OpenAlex, med en kort forklaring av hva hver av dem inneholder:

  • works
    Denne tabellen inneholder informasjon om akademiske publikasjoner, som artikler, bøker, konferansebidrag og preprints. Den inkluderer metadata som tittel, publikasjonstidspunkt, antall siteringer og andre siteringsberegninger og koblinger til faglige konsepter.
  • authors
    Inneholder data om forfattere av de enkelte publikasjoner
  • sources
    Representerer publikasjonssteder som tidsskrifter, konferanser, bokserier eller preprint-servere. Den inkluderer informasjon som tidsskriftnavn, ISSN, og koblinger til tilknyttede publikasjoner.
  • institutions
    Gir informasjon om institusjoner som er addressert på pubikasjonen. Inkluderer navn, geografisk plassering.
  • topics
    Inneholder en taksonomi for fagområder og emner i et hierarki på tre nivåer.
  • works_topics
    En krysstabell som knytter publikasjoner (works) til faglige konsepter (topics). Denne tabellen brukes til å koble artikler til spesifikke fagområder og emner.
  • works_authors
    En krysstabell som kobler publikasjoner (works) til forfattere (authors).
  • works_institutions
    En krysstabell som kobler publikasjoner (works) til institusjoner/forfatteradresse (institutions).

Emnekategorier

OpenAlex organiserer vitenskapelig informasjon primært ved hjelp av topics. Tabellen "concepts" var tidligere sentral for inndeling av disipliner, fagfelt og emner, men fases ut til fordel for topics. Concepts kan fremdeles benyttes.

  • Topics
    Inneholder ca. 4500 spesifikke emner som utledes fra metadata og tekstanalyse. Disse er representert i tabellen 'topics'. Hierarkiet består av nivåene field, subfield og domain. I tillegg er også keywords knyttet til hierarkiet.
    [Les mer på OpenAlex]
  • Keywords
    Nøkkelordene i OpenAlex blir generert automatisk på basis av topics-klassifisering og finnes også i topics-tabellen. [Les mer på OpenAlex

Del: Share to LinkedIn Share by mail