Slik jobber du med hierarkiske kodeverdier
Noen variabler inneholder sammensatte kodeverdier der verdienes posisjoner peker til ulike hierarkiske nivåer. Typisk peker de første sifrene til groveste inndeling, mens de etterfølgende peker på mer detaljerte undergrupper. Vi demonstrerer her hvordan disse ulike nivåene kan hentes ut.
Hierarkiske kodelister er koder som består av en viss mengde sifre (kan også være bokstaver eller andre tegn), der de første sifrene angir kategorisering på høyeste nivå, og jo flere sifre du inkluderer, jo lenger ned i hierarkiet beveger du deg (altså du øker detaljeringsnivået).
Felles for slike variabler er at verdiformatet er alfanumerisk/streng, og at du derfor kan benytte funksjonen substr()
til å trekke ut deler av kodeverdiene.
Kodeverdier har den fordelen at de inneholder mer enn én opplysning. Avhengig av hvor mange sifre du velger å benytte, så kan du hente ut informasjon på ulike nivåer.
Eksempler på slike variabler: Bosteds- og arbeidsstedskommune, utdanningskode, næringskode, yrkeskode.
Bosteds- og arbeidsstedskommune
Variabler som angir bosteds- eller arbeidsstedskommune inneholder en firesifret kommunekode der de to første sifrene peker til fylke:

Fylke kan trekkes ut på følgende måte:

Du kan dessuten legge til verdi-labler (verdietiketter) på følgende måte:

Utdanningskoder
Utdanningskoder er som regel seksifrede koder som bygger på NUS2000-standarden, der første siffer angir utdanningsnivå. Jo høyere verdi, jo høyere utdanningsnivå:

De neste sifrene angir informasjon om hva slags type studie man tar.
Slik trekker du ut utdanningsnivå:

Og slik lager du verdi-labler:

Næringskoder
Næringskoder bygger på ulike standarder, avhengig av hvilken tidsperiode man ser på. Nyeste standard er SN2007 som gjelder fra 2008. De to første sifrene angir hovednæringsgruppe. De etterfølgende sifrene peker på mer detaljerte næringer.

Eksempel på uttrekk av høyeste nivå (hovednæring):

Slik lager du verdi-labler til kodene (benytter SSB sin standardgruppering av hovednæringer):

Yrkeskoder
Yrkeskoder er firesifrede koder som baserer seg på STYRK-standarden. Første siffer angir hovednivå der man klassifiserer yrker etter kompetansekrav. Jo høyere verdi, jo lavere kompetansekrav.

Eksempel på uttrekk av yrkesnivå:

Slik lager du verdi-labler til kodene:

Det er fullt mulig å benytte en finere inndeling av yrker, dvs. tosifret eller tresifret kodeinndeling.
Eksempel på uttrekk av tosifret inndeling:

Slik lager du verdi-labler til kodene:

Verdi-labler
Variabler med hierarkiske kodeverdier har innebyggede labler i datasettet. Men dersom du ønsker å trekke ut deler av verdiene for å lage en grovere inndeling, må du selv opprette nye labler som passer til den grovere inndelingen. Slike labler finner du på SSB sin hjemmeside: https://www.ssb.no/klass/.
For mer detaljer om jobbing med hierarkiske koder og hvordan opprette verdi-labler i praksis, sjekk vår brukermanual. Der finner du også et skript som inneholder alle de omtalte omkodinger og label-operasjoner (kan kopieres inn i ditt eget skript).