Metoden Instrumental Variables (VI) används för att lösa endogenitetsproblemet för en eller flera oberoende variabler i en linjär regression.
Utseendet på endogenitet i en variabel indikerar att denna variabel är korrelerad med felterm. Med andra ord har en variabel som är korrelerad med de andra utelämnats. Vi pratar om förklarande variabler som visar en korrelation med felterm. En annan mycket populär metod för att lösa endogenitetsproblemet är Two-Stage Least Squares Estimator (LS2E). VI: s huvudfunktion är att detektera närvaron av en förklarande variabel i feltermen.
Introduktion till konceptet
Vi vill studera variationen i priserna på liftkort beroende på antalet backar och skidåkarnas riskaversion, vilket återspeglas i försäkringens kvalitet. Båda förklarande variablerna är kvantitativa variabler.
Vi antar att vi inkluderar variabeln försäkring i feltermen (u), vilket resulterar i:
Då blir försäkringsvariabeln en endogen förklarande variabel eftersom den tillhör feltermen och därför är korrelerad med den. Eftersom vi tar bort en förklarande variabel tar vi också bort dess regressor, i det här fallet, B2.
Om vi hade uppskattat den här modellen med vanliga minsta kvadrater (OLS), skulle vi ha fått en inkonsekvent och partisk uppskattning för B0 och Bk.
Vi kan använda modell 1.A om vi hittar en instrumentvariabel (z) för att spår uppfyller:
- Cov (z, eller) = 0 => z är inte korrelerad med eller.
- Cov (z, spår) ≠ 0 => z ja det är korrelerat med spår.
Denna instrumentvariabel (z) är exogen till modell 1 och har därför ingen partiell effekt på loggen (forfaits). Ändå är det relevant att förklara variation i spår.
Hypotes kontrast
För att veta om den instrumentella variabeln (z) är statistiskt korrelerad med den förklarande variabeln (ledtrådar) kan vi testa tillståndet Cov (z, ledtrådar) ≠ 0 givet ett slumpmässigt urval av befolkningen. För detta måste vi göra regressionen mellan spår Y z. Vi använder en annan nomenklatur för att skilja på vilka variabler som returneras.
Vi tolkar π0 Y πk på samma sätt som B0 och Bk i konventionella regressioner.
Vi förstår π1 = Cov (z, spår) / Var (z)
- Definition av hypotesen
I denna kontrast vill vi testa om det kan avvisas π1 = 0 vid en tillräckligt liten signifikansnivå (5%). Om den instrumentella variabeln (z) är korrelerad med den förklarande variabeln (ledtrådar) och för att kunna avvisa H0.
2. Kontraststatistik
3. Avvisningsregel
Vi bestämmer signifikansnivån vid 5%. Därför kommer vår avvisningsregel att baseras på | t | > 1,96.
- | t | > 1,96: vi förkastar H0. Det vill säga, vi avvisar inget samband mellan z och spår.
- | t | <1,96: vi har inte tillräckligt med betydande bevis för att avvisa H0. Vi avvisar inte att det inte finns någon korrelation mellan z och spår.
4. Slutsats
Om vi drar slutsatsen π1 = 0, statistiskt är den instrumentella variabeln (z) inte en bra approximation för den endogena variabeln.