Deskriptiv statistikk: summarize og boxplot

Skriptet nedenfor demonstrerer ulike måter å bruke kommandoene summarize og boxplot til å lage deskriptiv statistikk. Disse brukes på numeriske variabler for å lage oppsummerende statistikk som gjennomsnitt, standardavvik, antall enheter med gyldig verdi etc.

// Nøkkelstatistikk for metriske/kontinuerlige variabler
// Kommandoen summarize brukes for å vise nøkkelinformasjon om metriske/kontinuerlige variabler. Verdier som vises er gjennomsnitt, kvartiler m.m. Kommandoen boxplot viser de samme tallene grafisk gjennom standard boxplotfremstilling

require no.ssb.fdb:23 as db

create-dataset demografidata
import db/INNTEKT_WYRKINNT 2020-01-01 as innt
import db/INNTEKT_BRUTTOFORM 2020-01-01 as formue
import db/BEFOLKNING_KJOENN as kjønn
import db/BEFOLKNING_FOEDSELS_AAR_MND as faarmnd
import db/BOSATTEFDT_BOSTED 2020-01-01 as bosted

// Koder om fra kommune- til fylkesnivå 
generate fylke = substr(bosted,1,2)

// Lager alder per 2020
generate alder = 2020 - int(faarmnd/100)

summarize innt formue
summarize formue if alder > 50
summarize formue if bosted == '0301' 

boxplot innt formue
boxplot innt, over(kjønn)