Linjär sannolikhetsmodell

Innehållsförteckning:

Linjär sannolikhetsmodell
Linjär sannolikhetsmodell
Anonim

Den linjära sannolikhetsmodellen är en binärvalsmodell. I detta är den beroende villkoren för den beroende variabeln en linjär funktion, det vill säga förhållandet mellan den beroende variabeln och den förklarande variabeln (erna) är konstant.

För att se det på ett annat sätt är den linjära sannolikhetsmodellen en modell där vi har en beroende variabel och en oberoende variabel multiplicerad med en permanent koefficient (er).

Vi måste påpeka att den linjära sannolikhetsmodellen är en binärvalsmodell, det vill säga där den beroende variabeln kan ta två värden. Dessa värden är 1 eller 0 för att indikera framgång respektive misslyckande.

Den linjära sannolikhetsmodellen uttrycks enligt följande:

E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x

I den visade ekvationen tolkas den villkorade förväntningen på Y givet X som lika med β0 + β1x.

I det här fallet tar vi den villkorliga förväntningen, eftersom vi är intresserade av att veta sannolikheten för att en individ fattar ett beslut med tanke på deras egenskaper, till exempel (eller en annan oberoende variabel kan tas som referens).

Nackdelar med den linjära sannolikhetsmodellen

Några nackdelar med den linjära sannolikhetsmodellen är följande:

  • Den linjära sannolikhetsmodellen kan visa heteroskedasticitet. Nämligen, felvariansen är inte densamma i alla observationer som gjorts. I så fall används standardfel.
  • Det kan inte antas att felen är normalt distribuerade.
  • Den beroende variabeln kan bara ta två värden.
  • Det antas att de oberoende och beroende variablerna har en linjär relation, det vill säga förändringshastigheten är alltid densamma. Det kan dock vara mer exakt att bygga en modell där förändringshastigheten ökar när Y når ett högre värde, och det motsatta händer när Y minskar.

Med tanke på dessa nackdelar finns det logit- och probit-modellerna.

Exempel på en linjär sannolikhetsmodell

En linjär sannolikhetsmodell kan exempelvis konstrueras där den beroende variabeln är om personen för närvarande har ett formellt jobb som de har haft i ett år eller längre. De oberoende variablerna kan vara nivån på studier eller utbildningsnivå, kön och ålder.

I det visade exemplet blir den beroende variabeln 1 eller 0, men den måste tolkas kvalitativt, oavsett dess numeriska värde. Således betyder 1 att personen har ett formellt jobb som har bibehållits i mer än ett år, och 0 skulle vara den situation där detta inte inträffar.