Milepæl for microdata.no – fra prosjekt til kontinuerlig utvikling

Da Sikt og SSB lanserte microdata.no i 2018, ønsket vi å gjøre det raskere og enklere å få tilgang til viktige registerdata. Nå, etter noen år med prosjektbaserte forbedringer, er blikket rettet mot at brukermiljøene får mest mulig nytteverdi av tjenesten. Vi markerer overgangen ved å fortelle litt om hva tjenesten gjør, hvordan den har blitt brukt, og hva vi planlegger for fremtiden.

Registerdata er en rik og viktig kilde til kunnskap. Microdata.no er laget for å gi forskere, analytikere og masterstudenter rask og god tilgang til slike data. Her får du tilgang – uten ventetid – til å koble, bearbeide og analysere store mengder registerdata med lange tidsserier.

Starten av 2024 markerte avslutningen av infrastrukturprosjektet Microdata 2.0, finansiert gjennom Forskningsrådets nasjonale satsing på forskningsinfrastruktur. Prosjektperioden var 2020 til og med 2023. Forskningsrådet finansierte også første fase av utviklingen (RAIRD) som munnet ut i lanseringen av microdata.no i 2018.

Nå går tjenesten microdata.no over i en forvaltningsfase med kontinuerlig videreutvikling, og med en ny og tredelt finansieringsmodell i tråd med anbefalingene fra datainfrastrukturutvalget mai 2022 (grunnfinansiering, brukerbetaling, konkurranseutsatt finansiering). Vi markerer overgangen gjennom en kort oppsummering om hva tjenesten er, hva den har blitt brukt til så langt, og litt om hvor veien går videre.

Hva er registerdata? 

Registerdata er detaljerte administrative opplysninger hentet fra offentlige registre, og er en viktig kilde til kunnskap om samfunnet. Samtidig er registerdata beskyttet av lovverk som GDPR, Statistikkloven, m.m., og bruk av slike data til analyseformål er derfor forbundet med en del restriksjoner. 

Hva er poenget med microdata.no?

Poenget er å gjøre registerdata mest mulig tilgjengelig for bruk i forskning og analyse. Tradisjonell søknadsbasert tilgang til registerdata er tid- og ressurskrevende, og utelukker i praksis registerdata som kunnskapskilde for store brukergrupper. 

Microdata.no er utviklet med løsninger for innebygd personvern for å gi bred, og rik og fleksibel tilgang til analyse av registerdata helt uten ventetid. Og for at analyser, funn og resultater skal kunne deles enklest mulig med kollegaer og andre. 

Tjenesten er designet fra grunn av for nettopp registerdata og for å gjøre det raskt og enkelt å utnytte mulighetene registerdata gir til å analysere og sammenligne tall, trender og sammenhenger over tid og mellom regioner/grupper.  

Det er du som bruker som selv styrer valg av variabler, tidspunkt og tidsrom, koblinger, avledede variabler og omkodinger. Du definerer selv dine analysepopulasjoner via kriterier du formulerer og justerer underveis.  

Analyse- og visualiseringsmulighetene videreutvikles kontinuerlig og er godt beskrevet i brukermanualen, som også inneholder en rekke analyseeksempler du kan bruke for å bli kjent med verktøyets virkemåte.  

Statistikk og analyseresultater frembragt i microdata.no kan enkelt eksporteres over til regneark og andre verktøy for videre bearbeiding til bruk i publikasjoner. 

Hva kan microdata.no brukes til? 

For å illustrere litt av det tjenesten kan brukes til, er det nyttig å se hva den har blitt brukt til så langt, og hvilke data som er tilgjengelige der i dag. 

Siden lansering våren 2018 er microdata.no sitert som datakilde i godt over 200 publikasjoner. Bibliografien viser stor bredde i tematikk, bruksmåte og publiseringstype, og lister en rekke vitenskapelige publikasjoner (i nivå 2, nivå 1 og nivå 0-tidsskrift), rapporter, evalueringer, NOU-er, masteroppgaver, m.m.  

Tema som utenforskap, sosial ulikhet, migrasjons- og bosettingsmønstre, kjønnsforskjeller, sysselsetting, kompetansebehov, næringsmuligheter og utdanningstrender er gjengangere blant publikasjonene i bibliografien. 

Nedenfor ser du noen eksempler på ulike typer publikasjoner som har brukt microdata.no som kilde. 

Eksempler på vitenskapelige artikler: 

Eksempler på PhD-avhandlinger: 

Eksempler på analyser utført av eller for aktører i offentlig sektor: 

Eksempler på masteroppgaver: 

Hvilke data er tilgjengelige? 

Det er i dag tilgjengeliggjort ca. 500 registervariabler for kobling og analyse i microdata.no. En del variabler har tidsspenn helt tilbake til 1960. Variablene er godt beskrevet i tjenestens variabeloversikt som er tilgjengelig uten innlogging. 

Variablene dekker i dag bl.a. følgende emner: 

Ulike måter å bruke microdata.no på 

Bibliografien viser at tjenesten har vært benyttet på mange ulike måter og til mange ulike problemstillinger. En del publikasjoner har microdata.no som sin primære datakilde og ofte som eneste datakilde. Andre publikasjoner kombinerer microdata.no-analyser med analyser av andre data og ved hjelp av andre verktøy. 

Vi ser videre at enkelte har benyttet microdata.no til mindre del-analyser for å belyse kontekst, bakgrunn, utvalgsskjevhet o.l. for analyse av helt andre data.  

Tjenesten er også egnet for bruk i kombinasjon med søknadsbasert utlevering og kan heve presisjonen og kvaliteten på datasøknader, unngå misforståelser og korte ned tidsbruken i forbindelse med søknader til SSB.   

I statlig og regional forvaltning vet vi at microdata.no benyttes til publiserte analyser, men også i planlegging og saksforberedende arbeid og produksjon av informasjonsgrunnlag for politisk behandling. Dette materialet lar seg imidlertid i mindre grad fange opp eksternt, og bibliografien vår inneholder få eksempler på denne type bruk.  

Studentbruk av microdata.no har frem til nå hovedsakelig vært knyttet til masteroppgaver, men tjenesten har også vært benyttet i undervisningsøyemed i masterkurs (i f.eks. makroøkonomi). 

Deling av analyser/FAIR registerdata 

Sikt og SSB har gjennom arbeidet med microdata.no ønsket å forbedre alle FAIR-aspekter knyttet til tilgang til registerdata: 

  • Findable – alle variabler er godt dokumentert og søkbare i tjenesten og søkemotorer 
  • Accessible – du har umiddelbar tilgang til å jobbe med variabler du finner
  • Interoperable – tjenesten er laget for kobling av variabler på brukerens premisser 
  • Reusable – det er enkelt å dele microdata-skript for gjenbruk, videreutvikling og replikerbarhet 

Fordi microdata.no har støtte for dataversjonering og fordi alle koblinger, populasjonsdefinisjoner og analyser er uttrykt som tekstbaserte skript, er det trivielt å dele sine resultater med andre. 

En del brukernettverk deler, utveksler og samarbeider om utvikling av microdata.no-skript med fagfeller i eller utenfor egen organisasjon. Den enkleste formen for deling er å sende skript pr epost, slik at mottakeren kan «spille av» skriptet i microdata.no og jobbe ut fra utgangspunktet skriptet representerer.  

Vi ser videre at microdata.no-skript deles/siteres via Github, via Zenodo, via OSF og som appendix i selve publikasjonen. Sikt/SSB har også en plan om brukervennlig støtte for arkivering av microdata.no-skript i Nasjonalt vitenarkiv (NVA) når den tjenesten rulles ut, slik at forskere og studenter enkelt kan arkivere sine skript som resultat-objekter i NVA. 

Litt om veien videre 

Konseptet i microdata.no med rask og fleksibel tilgang gir en god del muligheter. Men den reelle nytteverdien av microdata.no avhenger primært av fire ting: 

  1. Hvilke data som er tilgjengelige der
  2. Hvilken funksjonalitet tjenesten har
  3. Evne til samspill med resten av økosystemet for tilgang til registerdata i inn- og utland 
  4. At mulighetene som ligger i tjenesten er kjent hos eksisterende og potensielle brukermiljøer 

Veien videre handler om kontinuerlig forbedring på alle punkter, i samarbeid og dialog med relevante brukermiljøer og andre aktører.  

En viktig del av Microdata 2.0-prosjektet som nå er avsluttet handlet om samarbeid med pilotpartner Kreftregisteret om teknologisk-juridiske løsninger og avklaringer for å gjøre microdata.no til en plattform hvor også andre dataeiere enn SSB kan tilgjengeliggjøre sine registerdata. Samarbeidet med Kreftregisteret (nå en del av FHI) fortsetter, og Sikt/SSB har også pågående samarbeid med flere registerdataeiere i helsesektoren og i kunnskapssektoren om det samme. SSB jobber også kontinuerlig med å tilgjengeliggjøre flere av sine registerdata i tjenesten. 

Videreutvikling av funksjonalitet (flere statistiske metoder, visualiseringer, bedre bearbeidingsverktøy, eksportmuligheter, integrasjoner) skjer kontinuerlig og i samarbeid med ulike brukermiljøer i forskning, analyse og offentlig planlegging. Microdata.no benytter etablerte og utvidbare tekniske komponenter, og kan i prinsippet støtte det meste av ønsket funksjonalitet innenfor rammene av innebygd personvern og så lenge automatisert anonymisering av statistikken som kommer ut er sikret. Sikt og SSB jobber kontinuerlig med å øke forståelsen av brukerbehovene og hvordan disse kan løses i tjenesten eller i samspill med andre tjenester. 

Microdata.no dekker og kan dekke en god del av behovene rundt bruk av registerdata. Men tjenesten er samtidig en del av et større økosystem som samlet sett dekker flere behov. Sikt og SSB har innledet ulike samarbeid med bl.a. Helsedataservice og andre relevante aktører i registerdatalandskapet for å bidra til en bedre hverdag for brukere av registerdata. 

Sikt er i gang med å etablere en microdata.no-relatert brukerstøttestilling samlokalisert med Helsedataservice på Tynset for å bygge opp om samarbeidet med helseregistermiljøene rundt bruk av registerdata, mens SSB og Helsedataservice møtes regelmessig for å diskutere ulike samordningsbehov, siden om lag 50% av all gjenbruk av data fra SSB ønskes sammenstilt med data fra helseregistre.

I november 2023 sendte Sikt, SSB, FHI og Kreftregisteret sammen en ny søknad om videreutvikling av microdata.no til Forskningsrådet i forbindelse med utlysningen av midler innenfor nasjonal satsing på forskningsinfrastruktur. Prosjektet handler om evne økt fokus, samarbeid og fart på videreutvikling langs de fire dimensjonene som er omtalt i dette avsnittet, og vi avventer nå resultatene av søknadsbehandlingen i Forskningsrådet.