Nye analysefunksjonaliteter: Diff-in-diff og «pooled» panelregresjon

Det er nå mulig å foreta diff-in-diff-analyser ved hjelp av den nye kommandoen regress-panel-diff. I tillegg er det nå tillatt å kjøre «pooled» panelregresjon.

«Pooled» panelregresjon

Lineære panelregresjoner har frem til nå vært mulig gjennom kommandoen regress-panel, med alternativene «fixed effects» (fe), «random effects» (re) og «between effects» (be).

Vi introduserer nå den nye opsjonen pooled som gjør det mulig å kjøre «pooled» panelregresjoner. Dette tilsvarer å kjøre vanlig lineær regresjon på paneldatasett, der man ser bort i fra tidsdimensjonen (betrakter alle observasjoner som separate enheter).

Eksempel:

Tilfeldig utvalg med paneluttrekk for årene 2018-2021. Avhengig variabel = årslønn, og man benytter sivilstand = gift, bosted = Oslo, og utdanningsnivå lik mastergrad eller høyere som forklaringsvariabler. Også år inngår for å kontrollere for tid.

Diff-in-diff

Diff-in-diff er en mye brukt analyseform der man analyserer effekten av en «behandling» gjennom å sammenlikne endringen i gjennomsnittsverdien for en kontinuerlig/rangerbar responsvariabel før/etter behandlingstidspunktet. Dette gjøres for to grupper: Behandlingsgruppen og kontrollgruppen. Til slutt finner man differansen mellom de to gruppene.

Følgende forberedende trinn må følges før man kan kjøre en diff-in-diff-analyse:

  1. Opprett et paneldatasett gjennom kommandoen import-panel eller ved å konvertere fra «wide»-format til «long»-format gjennom kommandoen reshape-to-long
  2. Lag en gruppevariabel med verdien 1 for behandlingsgruppen og 0 for kontrollgruppen
  3. Lag en behandlingsvariabel som settes til 0 for alle tidspunkter før behandlingstidspunktet, og 1 for alle tidspunkter fra og med behandlingstidspunktet.

Etter å ha fulgt trinnene 1. – 3. brukes kommandoen regress-panel-diff.

Den avhengige variabelen listes først. Den må være kontinuerlig eller rangerbar. Gruppe- og behandlingsvariablene skal listes som nummer 2 og 3. Dette er en forutsetning for at analysen skal bli riktig gjennomført. Øvrige uavhengige variabler listes til slutt (valgfritt).

Resultatet av regress-panel-diff viser en standard panelregresjonstabell med modellmål og koeffisientverdier. Diff-in-diff-verdien (såkalt ATET-verdi – average treatment effect of the treated) tilsvarer koeffisientverdien til interaksjonsleddet for de to dummyvariablene som angir hhv. gruppe og «behandling».

Eksempel:

Tilfeldig utvalg med paneluttrekk for årene 2018-2021. Bruker kvinner som behandlingsgruppe og menn som kontrollgruppe. Behandlingstidspunkt settes til 2020. Diff-in-diff-verdi (ATET) er lik -1991.77 når man kontrollerer for sivilstand = gift, bosted = Oslo, og utdanningsnivå lik mastergrad eller høyere. ATET-verdi er ikke signifikant i dette tilfellet.

Kommandoen regress-panel-diff tilsvarer å kjøre regress-panel med opsjonen pooled der gruppe-og behandlingsvariablene inngår som interaksjonsledd samt separate dummyer (bruker tegnene ## for å uttrykket dette).

Eksempel:
regress-panel-diff lønn gruppe behandling gift oslo høyutd
gir samme resultat som
regress-panel lønn gruppe##behandling gift oslo høyutd, pooled

Følgende opsjoner er tilgjengelige for regress-panel-diff:

  • level(): Definer et annet signifikansnivå enn standardverdien 95 (5% signifikansnivå)
  • robust: Robuste standardavvik
  • cluster(): Cluster-estimering

Bruk gjerne kommandoene help regress-panel-diff og help regress-panel inne i analyseverktøyet for mer informasjon om disse nye funksjonalitetene.

NB! Tid (f.eks. faktorledd som i.år) bør ikke inngå i regress-panel-diff-modeller ettersom man da vil kunne få 100% lik varians for behandlingsvariabelen sammenliknet med dummyleddene knyttet til årene fra og med behandlingstidspunktet. Koeffisientestimatene for de involverte variablene/leddene vil da bli feil.

Klikk her for lenke til analyseeksempel der man kjører en enkel diff-in-diff-analyse.