Bakgrunn
I Mareano/FAIR-sammenheng ble det høsten 2025 gjennomført en Proof of Concept (PoC) for å teste språkmodellers evne til å vurdere innhold i metadatafelt, initielt feltet «beskrivelse» («MD_DataIdentification.abstract», jf. ISO 19115 og 19139) i Geonorge. Dette arbeidet ble initiert på bakgrunn av et mål om å heve metadatakvaliteten i Geonorge, som i realiteten varierer i stor grad. Bedre metadata vil gagne både treffresultater med søkemotoren, og brukere som ønsker å finne ut av om datasettet er relevant for sitt bruk.
Selv om noe hjelpeinfo per felt er tilgjengelig i metadataeditor ved klikk på spørsmålsikon, så ser vi at det fortsatt er behov for å konkretisere og eksemplifisere slik at dataeier vet hva som skal skal oppgis av informasjon i de ulike metadatafeltene.
Derfor er det nå foreslått retningslinjer, eller kriterier, for akkurat hva metadatafeltet "beskrivelse" bør og ikke bør inneholde. På bakgrunn av retningslinjene er det utviklet et prompt som kan brukes til skriveassistanse og evaluering av tekst skrevet i dette metadatafeltet. KI-modellen vurderer, poenggir og begrunner resonnementet. Retningslinjene kan fint brukes uavhengig av KI-hjelp også, som en veileder til innhold for metadatafeltet "beskrivelse".
Oppsummert
Oppdraget:
- Bruke språkmodeller til skriveassistanse og evaluering av metadatabeskrivelsene
Formål:
- Gjøre data i Geonorge lettere å finne (Findable)
- Harmonisere/standardisere innhold i metadatabeskrivelsene
- Forenkle/effektivisere/automatisere prosessen med å lage metadatabeskrivelser
Kriteriene som vurderes
- Teksten beskriver klart hva datasettet inneholder
- Teksten beskriver tydelig hvor datasettet har dekning
- Teksten oppgir tydelig når dataene ble samlet inn eller gjelder for
- Teksten forklarer tydelig hvorfor dataene er samlet inn
- Teksten viser tydelig hvem som er ansvarlig for dataene
- Teksten er mellom 200 og 600 tegn, ekskludert mellomrom
- Hva datasettet inneholder (retningslinje 1) bør komme først i teksten. Deretter bør informasjon om hvor, når, hvorfor og hvem (retningslinje 2 til 5) følge, men rekkefølgen på disse er ikke utslagsgivende. Ytterligere informasjon bør følge etter dette.
- Teksten bruker korte, klare og enkle setninger
- Dersom teksten inneholder forkortelser, akronymer eller andre faguttrykk bør disse staves ut eller forklares første gang de nevnes i teksten, slik at teksten er forståelig for et bredt publikum
- Teksten er fri for stavefeil, syntaktiske og grammatiske feil
- Relevante nøkkelord er naturlig inkludert i teksten
- Teksten unngår prosessbeskrivelser og for mange detaljer rundt metode og datakilder
- Teksten unngår informasjon om lisens eller opphavsrett
- Teksten unngår informasjon om formater, koordinatsystemer og kartprojeksjoner
Hent evalueringspromptet
Promptet ligger åpent tilgjengelig på Geonorges repository på GitHub Docs:
https://kartverket.github.io/geonorge-docs/docs/Abstract%20prompt
Viktig:
- Kopier hele promptet (inkludert kriterier og instruksjoner)
- Ikke endre innholdet i promptet (bortsett tekst og nøkkelord)
-
Metoden er laget for datasett (nedlastbare data). Den er ikke primært laget for tjenester som WMS, WFS eller OGC API, men kan brukes veiledende.
- OBS! Metoden er kun ment som et hjelpende verktøy. KI-modellene kan selvsagt ta feil.
Fremgangsmåte
Finn tekst og nøkkelord fra metadata
Finn metadataoppføringen for datasettet du ønsker å evaluere i Geonorge. Finn feltet "Beskrivelse", og nøkkelordene, som ligger nederst i feltet "Detaljert informasjon".
Eventuelt; gå inn i metadataeditoren og finn beskrivelse i fanen "Grunnleggende", og nøkkelordene i fanen "Nøkkelord".
Sett tekst og nøkkelord inn i promptet
Erstatt plassholderne {{TEXT}} og {{KEYWORDS}} i promptet med henholdsvis beskrivelsen og nøkkelordene fra metadataene:
<text>
[lim inn beskrivelse]
</text>
<keywords>
[lim inn nøkkelord]
</keywords>
Lim inn og kjør promptet
Lim inn hele promptet i en avansert språkmodell (f.eks. ChatGPT, Copilot, Claude eller Gemini) og kjør det.
I utgangspunktet trenger du ikke legge til ekstra tekst – promptet er selvforklarende. Likevel står du fritt til å teste ut egne varianter om du er nysgjerrig. Lykke til!
Vi setter pris på tilbakemeldinger. Her er skjema du kan fylle ut for å gi din feedback.