Veileder for hvordan bruke KI-prompt for metadata fra FAIR/Mareano

Dataeiere inviteres til å teste ut et nytt verktøy for å løfte og kvalitetssikre metadata

Bakgrunn

I Mareano/FAIR-sammenheng ble det høsten 2025 gjennomført en Proof of Concept (PoC) for å teste språkmodellers evne til å vurdere innhold i metadatafelt, initielt feltet «beskrivelse» («MD_DataIdentification.abstract», jf. ISO 19115 og 19139) i Geonorge. Dette arbeidet ble initiert på bakgrunn av et mål om å heve metadatakvaliteten i Geonorge, som i realiteten varierer i stor grad. Bedre metadata vil gagne både treffresultater med søkemotoren, og brukere som ønsker å finne ut av om datasettet er relevant for sitt bruk.

Selv om noe hjelpeinfo per felt er tilgjengelig i metadataeditor ved klikk på spørsmålsikon, så ser vi at det fortsatt er behov for å konkretisere og eksemplifisere slik at dataeier vet hva som skal skal oppgis av informasjon i de ulike metadatafeltene.

Derfor er det nå foreslått retningslinjer, eller kriterier, for akkurat hva metadatafeltet "beskrivelse" bør og ikke bør inneholde. På bakgrunn av retningslinjene er det utviklet et prompt som kan brukes til skriveassistanse og evaluering av tekst skrevet i dette metadatafeltet. KI-modellen vurderer, poenggir og begrunner resonnementet. Retningslinjene kan fint brukes uavhengig av KI-hjelp også, som en veileder til innhold for metadatafeltet "beskrivelse".

Oppsummert

Oppdraget:

  • Bruke språkmodeller til skriveassistanse og evaluering av metadatabeskrivelsene

Formål:

  • Gjøre data i Geonorge lettere å finne (Findable)
  • Harmonisere/standardisere innhold i metadatabeskrivelsene
  • Forenkle/effektivisere/automatisere prosessen med å lage metadatabeskrivelser

Kriteriene som vurderes

  1. Teksten beskriver klart hva datasettet inneholder
  2. Teksten beskriver tydelig hvor datasettet har dekning
  3. Teksten oppgir tydelig når dataene ble samlet inn eller gjelder for
  4. Teksten forklarer tydelig hvorfor dataene er samlet inn
  5. Teksten viser tydelig hvem som er ansvarlig for dataene
  6. Teksten er mellom 200 og 600 tegn, ekskludert mellomrom
  7. Hva datasettet inneholder (retningslinje 1) bør komme først i teksten. Deretter bør informasjon om hvor, når, hvorfor og hvem (retningslinje 2 til 5) følge, men rekkefølgen på disse er ikke utslagsgivende. Ytterligere informasjon bør følge etter dette.
  8. Teksten bruker korte, klare og enkle setninger
  9. Dersom teksten inneholder forkortelser, akronymer eller andre faguttrykk bør disse staves ut eller forklares første gang de nevnes i teksten, slik at teksten er forståelig for et bredt publikum
  10. Teksten er fri for stavefeil, syntaktiske og grammatiske feil
  11. Relevante nøkkelord er naturlig inkludert i teksten
  12. Teksten unngår prosessbeskrivelser og for mange detaljer rundt metode og datakilder
  13. Teksten unngår informasjon om lisens eller opphavsrett
  14. Teksten unngår informasjon om formater, koordinatsystemer og kartprojeksjoner

Hent evalueringspromptet

Promptet ligger åpent tilgjengelig på Geonorges repository på GitHub Docs:

https://kartverket.github.io/geonorge-docs/docs/Abstract%20prompt

 

Viktig:

  • Kopier hele promptet (inkludert kriterier og instruksjoner)
  • Ikke endre innholdet i promptet (bortsett tekst og nøkkelord)
  • Metoden er laget for datasett (nedlastbare data). Den er ikke primært laget for tjenester som WMS, WFS eller OGC API, men kan brukes veiledende. 

  • OBS! Metoden er kun ment som et hjelpende verktøy. KI-modellene kan selvsagt ta feil. 

 

Fremgangsmåte

Finn tekst og nøkkelord fra metadata

Finn metadataoppføringen for datasettet du ønsker å evaluere i Geonorge. Finn feltet "Beskrivelse", og nøkkelordene, som ligger nederst i feltet "Detaljert informasjon".

 

Eventuelt; gå inn i metadataeditoren og finn beskrivelse i fanen "Grunnleggende", og nøkkelordene i fanen "Nøkkelord".

Sett tekst og nøkkelord inn i promptet

Erstatt plassholderne {{TEXT}} og {{KEYWORDS}} i promptet med henholdsvis beskrivelsen og nøkkelordene fra metadataene:

<text>
[lim inn beskrivelse]
</text>

<keywords>
[lim inn nøkkelord]
</keywords>

Lim inn og kjør promptet

Lim inn hele promptet i en avansert språkmodell (f.eks. ChatGPT, Copilot, Claude eller Gemini) og kjør det.
I utgangspunktet trenger du ikke legge til ekstra tekst – promptet er selvforklarende. Likevel står du fritt til å teste ut egne varianter om du er nysgjerrig. Lykke til!

Vi setter pris på tilbakemeldinger. Her er skjema du kan fylle ut for å gi din feedback.