Relevant variabel utelämnad

Innehållsförteckning

Utelämnandet av en relevant variabel är att en viktig förklarande variabel inte tas med i en regression. Med tanke på Gauss-Markov-antagandena skulle detta utelämnande orsaka partiskhet och inkonsekvens i våra uppskattningar.

Med andra ord, utelämnandet av en relevant variabel inträffar när vi införlivar den i feltermen u eftersom vi inte tar hänsyn till den. Detta kommer att orsaka en korrelation mellan den beroende variabeln och felterm u.

Matematiskt antar vi att:

Cov (x, u) = 0

Om vi ​​införlivar en relevant variabel i feltermen eller, sedan:

Cov (x, u) ≠ 0

Med tanke på Gauss-Markov-antagandena är denna korrelation:

(ρ (x, u) ≠ 0)

Det skulle inte uppfylla det:

E (u | x) = E (u) = 0

Det vill säga förväntningen på felen som är villkorade till de förklarande är lika med förväntningen på felet och att det också är noll. Dessa är antagandena om opartiskhet (strikt exogenitet + nollmedelvärde)

I fall av uteslutande av den relevanta variabeln är OLS-uppskattaren partisk och blir inkonsekvent. Så det bryter mot två av uppskattningsegenskaperna och gör att vår uppskattning är fel.

Teoretiskt exempel

Vi antar att vi vill studera antalet säsongsskidåkare (t) med hänsyn till flera faktorer: priset på liftkort (liftkort) och antalet öppna backar (backar) och kvaliteten på snön (snö).

Modell 0

Vi antar att de förklarande variablerna (liftkort, backar och snö) är relevanta variabler för modell 0 eftersom de tillhör befolkningsmodellen. Med andra ord har de förklarande variablerna i vår modell 0 en partiell effekt på de beroende variabla skidåkarna i befolkningsmodellen. Då kommer både populationen och modellmodellerna (modell 0) att ha andra koefficienter än noll.

Tolkning

En ökning av snökvaliteten (snö) och antalet öppna körningar (spår) orsakar en ökning av uppskattningarna av β2 och β3. Följaktligen återspeglas detta i antalet åkare (åkare).

En procentuell ökning av liftkortpriserna orsakar en minskning av β1/ 100 i antalet åkare (åkare)

Bearbeta

Vi behandlar snövariabeln som en utelämnad variabel från modellen. Sedan:

Modell 1

Vi skiljer felterm u från modell 0 och felterm v från modell 1 eftersom den ena inte innehåller den relevanta variabla snön och den andra inte.

I modell 1 har vi utelämnat en relevant variabel från modellen och introducerat den i feltermen u. Detta innebär att:

  • Cov (snö, v) ≠ 0 → ρ (snö, v) ≠ 0
  • E (v | snö) ≠ 0

Om vi ​​utelämnar den relevanta variabla snön i vår modell 1 kommer vi att få OLS-uppskattaren att presentera förspänning och inkonsekvens. Så vår uppskattning av antalet säsongsskidåkare blir fel. Skidorten kan ha allvarliga ekonomiska problem om du tar hänsyn till vår modell 1-uppskattning.