Nye analysefunksjonaliteter: Diff-in-diff og «pooled» panelregresjon
Det er nå mulig å foreta diff-in-diff-analyser ved hjelp av den nye kommandoen regress-panel-diff. I tillegg er det nå tillatt å kjøre «pooled» panelregresjon.
«Pooled» panelregresjon
Lineære panelregresjoner har frem til nå vært mulig gjennom kommandoen regress-panel
, med alternativene «fixed effects» (fe
), «random effects» (re
) og «between effects» (be
).
Vi introduserer nå den nye opsjonen pooled
som gjør det mulig å kjøre «pooled» panelregresjoner. Dette tilsvarer å kjøre vanlig lineær regresjon på paneldatasett, der man ser bort i fra tidsdimensjonen (betrakter alle observasjoner som separate enheter).
Eksempel:
Diff-in-diff
Diff-in-diff er en mye brukt analyseform der man analyserer effekten av en «behandling» gjennom å sammenlikne endringen i gjennomsnittsverdien for en kontinuerlig/rangerbar responsvariabel før/etter behandlingstidspunktet. Dette gjøres for to grupper: Behandlingsgruppen og kontrollgruppen. Til slutt finner man differansen mellom de to gruppene.
Følgende forberedende trinn må følges før man kan kjøre en diff-in-diff-analyse:
- Opprett et paneldatasett gjennom kommandoen
import-panel
eller ved å konvertere fra «wide»-format til «long»-format gjennom kommandoenreshape-to-long
- Lag en gruppevariabel med verdien 1 for behandlingsgruppen og 0 for kontrollgruppen
- Lag en behandlingsvariabel som settes til 0 for alle tidspunkter før behandlingstidspunktet, og 1 for alle tidspunkter fra og med behandlingstidspunktet.
Etter å ha fulgt trinnene 1. – 3. brukes kommandoen regress-panel-diff
.
Den avhengige variabelen listes først. Den må være kontinuerlig eller rangerbar. Gruppe- og behandlingsvariablene skal listes som nummer 2 og 3. Dette er en forutsetning for at analysen skal bli riktig gjennomført. Øvrige uavhengige variabler listes til slutt (valgfritt).
Resultatet av regress-panel-diff
viser en standard panelregresjonstabell med modellmål og koeffisientverdier. Diff-in-diff-verdien (såkalt ATET-verdi – average treatment effect of the treated) tilsvarer koeffisientverdien til interaksjonsleddet for de to dummyvariablene som angir hhv. gruppe og «behandling».
Eksempel:
Kommandoen regress-panel-diff
tilsvarer å kjøre regress-panel
med opsjonen pooled
der gruppe-og behandlingsvariablene inngår som interaksjonsledd samt separate dummyer (bruker tegnene ## for å uttrykket dette).
Eksempel:regress-panel-diff lønn gruppe behandling gift oslo høyutd
gir samme resultat somregress-panel lønn gruppe##behandling gift oslo høyutd, pooled
Følgende opsjoner er tilgjengelige for regress-panel-diff
:
level()
: Definer et annet signifikansnivå enn standardverdien 95 (5% signifikansnivå)robust
: Robuste standardavvikcluster()
: Cluster-estimering
Bruk gjerne kommandoene help regress-panel-diff
og help regress-panel
inne i analyseverktøyet for mer informasjon om disse nye funksjonalitetene.
NB! Tid (f.eks. faktorledd som i.år) bør ikke inngå i regress-panel-diff-modeller ettersom man da vil kunne få 100% lik varians for behandlingsvariabelen sammenliknet med dummyleddene knyttet til årene fra og med behandlingstidspunktet. Koeffisientestimatene for de involverte variablene/leddene vil da bli feil.
Klikk her for lenke til analyseeksempel der man kjører en enkel diff-in-diff-analyse.