Binära valmodeller är modeller där den beroende variabeln bara tar två värden: 1 för att indikera "framgång" eller "0" för att indikera misslyckande. De konkreta uppskattningsmodellerna är: linjär sannolikhet, logit och probit.
I den enkla eller multipla regressionsmodellen som lärs ut i den inledande ekonometri-kursen har den beroende variabeln vanligtvis en ekonomisk tolkning (såsom ökning av BNP, investeringar eller konsumtion) från andra förklarande variabler.
Men vilken modell använder vi när vi vill förklara händelser som bara har två möjligheter? Till exempel: klara ämnet eller inte klara det, examen från college eller inte examen, vara anställd eller arbetslös, etc. Detta är vad binära valmodeller svarar på.
I vart och ett av dessa fall kan du göra Y = 1 betecknar "framgång"; Y = 0 betecknar "misslyckande". Av denna anledning kallas de binära valmodeller och ekvationen den använder är så här:
På detta sätt får vi sannolikheten för framgång för en viss variabel.
Hittills har det ingen större komplikation. Uppskattning och tolkning av parametrarna kräver dock större försiktighet.
RegressionsmodellModeller för att uppskatta binära parametrar
Med tanke på de ovannämnda egenskaperna hos den oberoende variabeln finns det tre modeller för att uppskatta parametrarna:
- Linjär sannolikhetsmodell. Det beräknas genom normal OLS.
- Logit-modell. Den beräknas med en standardlogistisk distributionsfunktion.
- Probit-modell. Det beräknas med en normal normalfördelningsfunktion.
Linjär sannolikhetsmodell
Den linjära sannolikhetsmodellen (MPL) heter så eftersom sannolikheten
svaret är linjärt med avseende på parametrarna i ekvationen. För uppskattningen använd vanliga minsta kvadrater (OLS)
Den beräknade ekvationen är skriven
Den oberoende variabeln (och hatt) är den förutsagda sannolikheten för framgång.
B0 cap är den förutsagda sannolikheten för framgång när var och en av x-erna är lika med noll. Koefficienten B1 cap mäter variationen av den förutsagda sannolikheten för framgång när x1 ökar en enhet.För att korrekt tolka en linjär sannolikhetsmodell måste vi ta hänsyn till vad som anses vara en framgång och vad som inte är.
Exempel på binärvalsmodell
Ekonomen Jeffrey Wooldridge uppskattade en ekonometrisk modell där den binära variabeln anger om en gif.webpt kvinna deltog i arbetskraften (förklarad variabel) under 1975. I detta fall Y = 1 innebar att e deltog Y = 0 som inte gjorde det.
Modellen använder makens inkomstnivå som förklarande variabler (hinc), år av utbildning (utbilda), års erfarenhet på arbetsmarknaden (exper), ålder (ålder), antalet barn under sex år (kidslt6) och antalet barn mellan 6 och 18 år (kidsge6).
Vi kan verifiera att alla variabler utom kidsge6 är statistiskt signifikanta och att alla signifikanta variabler har den förväntade effekten.
Nu är tolkningen av parametrarna så här:
- Om du ökar ett års utbildning, ceteris paribus, ökar sannolikheten för att gå med i arbetskraften med 3,8%.
- Om erfarenheten ökar på ett år ökar sannolikheten för att vara en del av arbetskraften med 3,9%.
- Om du har ett barn under 6 år, ceteris paribus, minskar sannolikheten för att vara en del av arbetskraften med 26,2%.
Så vi ser att den här modellen berättar vilken effekt varje situation har på sannolikheten för att en kvinna formellt anställs.
Denna modell kan användas för att utvärdera allmän politik och sociala program, eftersom förändringen i den "förutsagda sannolikheten för framgång" kan kvantifieras med avseende på enhets- eller marginalförändringar i de förklarande variablerna.
Nackdelar med den linjära sannolikhetsmodellen
Denna modell har dock två huvudsakliga nackdelar:
- Det kan ge sannolikheter mindre än noll och större än en, vilket inte är meningsfullt när det gäller att tolka dessa värden.
- De partiella effekterna är alltid konstanta. I den här modellen är det ingen skillnad mellan att gå från noll barn till ett barn än att gå från två till tre barn.
- Eftersom den förklarande variabeln endast tar värdena noll eller en, kan heteroscedasticitet genereras. Standardfel används för att lösa detta.
För att lösa de två första problemen, som är de viktigaste i den linjära sannolikhetsmodellen, designades Logit- och Probit-modellerna.
Referenser:
Wooldridge, J. (2010) Introduktion till ekonometri. (4: e upplagan) Mexiko: Cengage Learning.