Ny funksjonalitet: Outer join

Ved variabelimport i microdata.no er standardløsningen «left join», der den første variabelen som importeres inn i et datasett bestemmer populasjonen. Men nå er det også mulig å importere data med bruk av «outer join». Da vil også nye individer/enheter som ikke eksisterer i din opprinnelige populasjon bli lagt til datasettet ditt.

Frem til nå har det vært slik at dersom en vil ha med seg alle enheter/individer for et sett med variabler, så måtte en starte med å importere en universell variabel som f.eks. «kjønn». Da vil populasjonen din være alle individer med en verdi på variabelen «kjønn», altså tilnærmet alle i databasen, og man risikerer ikke at enheter/individer som kun har en verdi for en av de neste variablene ikke kommer med i populasjonen. Dette slipper en nå, siden en kan bruke «outer join» som opsjon til import. Da kan du konsentrere deg om de variablene du faktisk er interessert i, uten å gå en omvei via «kjønn».

Et eksempel på et nyttig bruksområde er når en skal lage et datasett bestående av månedlige jobbopplysninger målt over en lengre tidsperiode. Da vil standardløsningen med «left join» gjøre at det kun er de jobbene som blir målt ved første måletidspunkt som danner datasettets populasjon. Når en deretter skal importere jobbdata for de påfølgende måneder, vil ikke nye jobber legges til datasettet siden de ikke eksisterer for det første måletidspunktet. Ved å bruke «outer join» vil også nye jobber legges til datasettet slik at du får med alle aktive jobber over hele tidsperioden.

Standardløsningen med «left join» brukes så lenge du ikke angir en «outer join»-opsjon. Eksempel på bruk av «outer join»: import db/INNTEKT_WLONN 2019-12-31 as lønn19, outer_join

Merk at «outer join» ikke er relevant å bruke for den første import-kommando du kjører. Det er kun for de påfølgende import-kommandoer denne funksjonaliteten kan være nyttig.

Standardløsningen med «left join» vil fortsatt være å foretrekke dersom du har laget en populasjon og ikke ønsker å endre på denne når du importerer nye variabler.

Eksempel A: Import av arbeidstid målt i januar-mars 2021 for jobber som var aktive i januar, ved bruk av standard left join:

Eksempel B: Import av arbeidstid målt i januar-mars 2021 for alle jobber som var aktive i perioden ved bruk av outer join: