The Gauss-Markov Theorem är en uppsättning antaganden som en OLS (Ordinary Least Squares) uppskattare måste uppfylla för att kunna betraktas som ELIO (Optimal Linear Unbiased Estimator). OCHsatsen Gauss-Markov formulerades av Carl Friederich Gauss och Andrei Markov.
Carl Friederich Gauss och Andréi Márkov fastställde några antaganden så att en OLS-uppskattare kunde bli ELIO.
Om dessa 5 antaganden uppfylls kan vi bekräfta att uppskattaren är den med den minsta avvikelsen (mest exakta) för alla linjära och opartiska uppskattare. I händelse av att något av antagandena från de tre första misslyckas (linjäritet, noll genomsnittlig strikt exogenitet eller ingen perfekt multikollinearitet) är OLS-uppskattaren inte längre opartisk. Om bara 4 eller 5 misslyckas (homoscedasticitet och ingen autokorrelation) är estimatorn fortfarande linjär och opartisk, men den är inte längre den mest exakta. Sammanfattningsvis säger Gauss-Markovs satsen att:
- Enligt antagandena 1, 2 och 3 är OLS-uppskattaren linjär och opartisk. Nu, inte så länge som de tre första antagandena är uppfyllda, kan det säkerställas att uppskattaren är opartisk. För att uppskattaren ska vara konsekvent måste vi ha ett stort urval, ju mer desto bättre.
- Under antagandena 1, 2, 3, 4 och 5 är OLS-uppskattaren linjär, opartisk och optimal (ELIO).
Antaganden från Gauss-Markovs teorem
Specifikt finns det 5 antaganden:
1. Linjär modell i parametrarna
Det är ett ganska flexibelt antagande. Det gör det möjligt att använda funktioner för variablerna av intresse.
2. Noll genomsnitt och strikt exogenitet
Det innebär att medelvärdet av felet som är villkorat av förklaringar är lika med det ovillkorliga förväntade värdet och är lika med noll. Dessutom kräver strikt exogenitet att modellfel inte är korrelerade med några observationer.
Noll betyder:
Strikt exogenitet:
Noll genomsnitt och strikt exogenitet misslyckas om:
- Modellen är dåligt specificerad (till exempel utelämnande av relevanta variabler).
- Det finns mätfel i variablerna (uppgif.webpterna har inte granskats).
- I tidsserier misslyckas strikt exogenitet i fördröjda endogenitetsmodeller (även om det kan finnas exogenitet samtidigt) och i fall där det finns feedbackeffekter.
I tvärsnittsdata är det mycket lättare att uppnå antagandet om exogenitet än i fallet med tidsserier.
3. Ingen exakt multikollinearitet
I urvalet är ingen av de förklarande variablerna konstant. Det finns inga exakta linjära samband mellan förklarande variabler. Det utesluter inte någon (inte perfekt) korrelation mellan variablerna. Enligt Gauss och Markov beror det vanligtvis på en analytikers fel när en modell har exakt multikollinearitet.
4. Homoscedasticitet
Variansen av felet, och därför av Y, är oberoende av de förklarande värdena och dessutom variansen för det konstanta felet. Matematiskt uttrycks det som:
Här är en serie data med homoscedastiskt utseende.
5. Ingen autokorrelation
Felvillkoren för två olika observationer som är villkorade av X är inte relaterade. Om provet är slumpmässigt kommer det inte att finnas någon autokorrelation.
Där jag måste ha ett annat värde än h. Om provet är slumpmässigt kommer data och observationsfelen "i" och "h" att vara oberoende för alla observationspar "i" och "h".