Gå til hovedinnhold

GeoGPT - Søk i geografiske data med språkmodeller

Hopp til hovedinnhold

GeoGPT - Søk i geografiske data med språkmodeller

Prosjektsammendrag

Dette prosjektet har laget en "proof of concept" ved å benytte språkmodeller og vektordatabase til gjenfinning av geografisk data, for å forbedre søkefunksjonen på Kartverkets portal Geonorge.no.
Som prosjektmetodikk har gruppen hovedsakelig benyttet Scrum med Jira som styringsverktøy.

 

Prosjektmålet ble definert slik:
“Oppnå en “proof of concept”, ved bruk av språkmodell og vektordatabase, for å gjøre søk på Geonorge mer presise og brukervennlige for brukere uavhengig av fagkompetanse”

 

Prosjektbeskrivelse

Prosjektet har vært utforskende av natur med et høyt nivå av usikkerhet og risiko knyttet til valg av teknologiske løsninger. Gruppen har gjennomført prosjekt fra A-Å, med målsetning om å levere en "proof of concept"-løsning som sluttprodukt. Fiktivt har gruppen vært konsulenter ansatt i Tietoevry og jobbet på prosjektet for kunden Kartverket.

Prosjektprosess

Oppbyggingen har bestått av innsikts- og analysearbeid innledningsvis, for å få forståelse for kontekst og geografisk informasjonssystemer (GIS). Denne forståelsen var ukjent for gruppen ved oppstart.

Økt forståelse for bruken av Geonorge.no ble skaffet ved hjelp av brukerinnsikt mot Norge digital medlemmer. Her ble semi-strukturerte intervjuer benyttet sammen med observasjoner.

Hoveddelen i prosjektet har bestått av å utforske relevante teknologier. Hensikten har vært å synliggjøre fornuftige teknologier som kan tas i bruk for å bedre søkefunksjonen på Geonorge.no, en slags benchmarking av de ulike alternativene og visning av mulig sammensetning eller arkitektur av teknologiene med en "proof of concept".

Teknologi

Den tekniske løsningen baserer seg på bruk av vektordatabasesøk med språkmodell embeddings og Retrieval Agumented Generation (RAG) for instruks av språkmodell til å besvare spørsmål med relevant kontekst hentet fra Vektor DB. I utviklingen er det brukt Javascript med HTML og CSS. For vektordatabasesøk er det benyttet PostgreSQL med Pgvector. Python, Pandas og Regex er benyttet blant annet for å rense metadata for DOK datasettene fra Geonorge. Docker, shell scripts og batch script er brukt for oppsett og kjøring av Vektor DB.

 

Ved spørsmål om prosjektet?

Kontakt Lars Gunnar Stokke
Mob: 48113414
Mail: Lg_stokke@hotmail.com

Fullført oppgave

Publisert:2024-05-16
Grad: Bachelor
Studium: Bachelor IT og informasjonssystemer (BACIT)
Leverings­tidspunkt: 2024 - Vår
Samarbeid: Kartverket og Tietoevry

Fagområder

Fakultet

Emnekoder

Deltakere

  • Aleksander Grimstad Mo
  • Carsten Østergaard
  • Lars Gunnar Stokke
  • Theodor Litlere
  • William Peter Johansson Åredal