Endogenitet (økonometri) - Endogeneity (econometrics)

I econometrics , endogenitet bredt henviser til situasjoner hvor en forklarende variabel er korrelert med den feilleddet . Skillet mellom endogene og eksogene variabler stammer fra samtidige ligningsmodeller , hvor man skiller variabler hvis verdier blir bestemt av modellen fra variabler som er forhåndsbestemt; ignorering av samtidighet i estimeringen fører til partiske estimater da det bryter med antagelsen om eksogenitet fra teoremet Gauss – Markov . Problemet med endogenitet blir dessverre ofte ignorert av forskere som driver ikke-eksperimentell forskning, og gjør det utelukkende å komme med politiske anbefalinger. Instrumentale variable teknikker brukes ofte til å løse dette problemet.

Dessuten samtidighet kan korrelasjon mellom forklaringsvariablene og feilleddet oppstår når en ubemerket eller utelates variable blir sammenblanding av både uavhengige og avhengige variabler, eller når uavhengige variabler målt med feil .

Eksogenitet versus endogenitet

I en stokastisk modell kan forestillingen om vanlig eksogenitet , sekvensiell eksogenitet , sterk / streng eksogenitet defineres. Eksogenitet er artikulert på en slik måte at en variabel eller variabler er eksogene for parameter . Selv om en variabel er eksogen for parameteren , kan den være endogen for parameteren .

Når forklaringsvariablene ikke er stokastiske, så er de sterke eksogene for alle parametrene.

Hvis den uavhengige variabelen er korrelert med feiluttrykket i en regresjonsmodell , er estimatet av regresjonskoeffisienten i en vanlig minste kvadrat (OLS) regresjon partisk ; men hvis korrelasjonen ikke er samtidig, kan koeffisientestimatet fortsatt være konsistent . Det er mange metoder for å korrigere skjevheten, inkludert instrumentell variabel regresjon og Heckman-valgkorreksjon .

Statiske modeller

Følgende er noen vanlige kilder til endogenitet.

Utelatt variabel

I dette tilfellet kommer endogeniteten fra en ukontrollert forvirrende variabel , en variabel som er korrelert med både den uavhengige variabelen i modellen og med feiluttrykket. (Tilsvarende påvirker den utelatte variabelen den uavhengige variabelen og påvirker den avhengige variabelen separat.)

Anta at den "sanne" modellen som skal estimeres er

men er utelatt fra regresjonsmodellen (kanskje fordi det ikke er noen måte å måle den direkte). Da er modellen som faktisk er estimert

hvor (dermed har begrepet blitt absorbert i feiluttrykket).

Hvis korrelasjonen til og ikke er 0 og påvirker hver for seg (betydning ), er den korrelert med feiluttrykket .

Her er ikke eksogent for og , siden gitt , fordelingen av avhenger ikke bare av og , men også av og .

Målefeil

Anta at et perfekt mål på en uavhengig variabel er umulig. Det vil si, i stedet for å observere , er det som faktisk observeres hvor målefeil eller "støy" er. I dette tilfellet en modell gitt av

kan skrives i form av observerbare og feiluttrykk som

Siden både og er avhengig av , de er korrelert, slik at OLS estimert vil bli forspent nedover.

Målefeil i den avhengige variabelen forårsaker ikke endogenitet, selv om den øker variansen til feilbegrepet.

Samtidighet

Anta at to variabler er kodebestemt, hvor hver påvirker den andre i henhold til følgende "strukturelle" ligninger :

Å estimere hver ligning i seg selv resulterer i endogenitet. I tilfelle av det første strukturelle ligningen . Løs for mens du antar at det resulterer i

.

Forutsatt at og ikke er korrelert med ,

.

Derfor vil forsøk på å estimere en strukturell ligning være hemmet av endogenitet.

Dynamiske modeller

Endogenitetsproblemet er spesielt relevant i sammenheng med tidsserie- analyse av årsaksprosesser . Det er vanlig at noen faktorer i et kausalsystem er avhengig av verdien i periode t av verdiene til andre faktorer i kausalsystemet i periode t  - 1. Anta at nivået av skadedyrsangrep er uavhengig av alle andre faktorer i en gitt periode, men er påvirket av nivået av nedbør og gjødsel i forrige periode. I dette tilfellet vil det være riktig å si at angrep er eksogent i løpet av perioden, men endogent over tid.

La modellen være y  =  f ( xz ) +  u . Hvis variabelen x er sekvensiell eksogen for parameter , og y ikke forårsaker x i Granger-forstand , så er variabelen x sterkt / strengt eksogen for parameteren .

Samtidighet

Generelt sett oppstår samtidighet i den dynamiske modellen, akkurat som i eksemplet med statisk samtidighet ovenfor.

Se også

Referanser

Videre lesning

Eksterne linker