Den laggade distribuerade autoregressiva (ADR) modellen, från engelska Autoregressiv distribuerad lagmodell(ADL), är en regression som involverar en ny fördröjd oberoende variabel utöver den fördröjda beroende variabeln.
Med andra ord är ADR-modellen en förlängning av p-ordningens autoregressiva modell, AR (p), som inkluderar en annan oberoende variabel under en tidsperiod före den beroende variabelns period.
Exempel
Baserat på data från 1995 till 2018 beräknar vi de naturliga logaritmerna förliftkort för varje år och vi går tillbaka en period för variablernaliftkortt och spårt:
År | Skipass (€) | ln_t | ln_t-1 | Spår_t | Spår_t-1 | År | Skipass (€) | ln_t | ln_t-1 | Spår_t | Spår_t-1 |
1995 | 32 | 3,4657 | 8 | 2007 | 88 | 4,4773 | 4,3820 | 6 | 9 | ||
1996 | 44 | 3,7842 | 3,4657 | 6 | 8 | 2008 | 40 | 3,6889 | 4,4773 | 5 | 6 |
1997 | 50 | 3,9120 | 3,7842 | 6 | 6 | 2009 | 68 | 4,2195 | 3,6889 | 6 | 5 |
1998 | 55 | 4,0073 | 3,9120 | 5 | 6 | 2010 | 63 | 4,1431 | 4,2195 | 10 | 6 |
1999 | 40 | 3,6889 | 4,0073 | 5 | 5 | 2011 | 69 | 4,2341 | 4,1431 | 6 | 10 |
2000 | 32 | 3,4657 | 3,6889 | 5 | 5 | 2012 | 72 | 4,2767 | 4,2341 | 8 | 6 |
2001 | 34 | 3,5264 | 3,4657 | 8 | 5 | 2013 | 75 | 4,3175 | 4,2767 | 8 | 8 |
2002 | 60 | 4,0943 | 3,5264 | 5 | 8 | 2014 | 71 | 4,2627 | 4,3175 | 5 | 8 |
2003 | 63 | 4,1431 | 4,0943 | 6 | 5 | 2015 | 73 | 4,2905 | 4,2627 | 9 | 5 |
2004 | 64 | 4,1589 | 4,1431 | 6 | 6 | 2016 | 63 | 4,1431 | 4,2905 | 10 | 9 |
2005 | 78 | 4,3567 | 4,1589 | 5 | 6 | 2017 | 67 | 4,2047 | 4,1431 | 8 | 10 |
2006 | 80 | 4,3820 | 4,3567 | 9 | 5 | 2018 | 68 | 4,2195 | 4,2047 | 6 | 8 |
2019 | ? | ? | 4,2195 | 6 |
För att göra regressionen använder vi värdena för ln_t som en beroende variabel och värdenaln_t-1 Yspår_t-1 som oberoende variabler. Värden i rött ligger utanför regressionen.
Vi får regressionens koefficienter:
I det här fallet är regressionernas tecken positivt:
- En ökning med 1€ i prisetliftkort under föregående säsong (t-1) steg den med en ökning med 0,48€i priset påliftkort för den här säsongen (t).
- En ökning av en svart bana som öppnades under föregående säsong (t-1) innebär en ökning med 4,1% i priset påliftkort för den här säsongen (t).
Värdena inom parentes under koefficienterna är standardfelen i uppskattningarna.
Vi ersätter
Sedan,
År | Skipass (€) | Spår | År | Skipass (€) | Spår |
1995 | 32 | 8 | 2007 | 88 | 6 |
1996 | 44 | 6 | 2008 | 40 | 5 |
1997 | 50 | 6 | 2009 | 68 | 6 |
1998 | 55 | 5 | 2010 | 63 | 10 |
1999 | 40 | 5 | 2011 | 69 | 6 |
2000 | 32 | 5 | 2012 | 72 | 8 |
2001 | 34 | 8 | 2013 | 75 | 8 |
2002 | 60 | 5 | 2014 | 71 | 5 |
2003 | 63 | 6 | 2015 | 73 | 9 |
2004 | 64 | 6 | 2016 | 63 | 10 |
2005 | 78 | 5 | 2017 | 67 | 8 |
2006 | 80 | 9 | 2018 | 68 | 6 |
2019 | 63 |
ADR (p, q) vs. AR (p)
Vilken modell är bäst lämpad för att förutsäga priserna påliftkort med tanke på ovanstående observationer, AR (1) eller ADR (1,1)? Med andra ord, införlivar du den oberoende variabelnspårt-1 i regression hjälper till att bättre passa vår förutsägelse?
Vi tittar på R-kvadraten av modellernas regressioner:
Modell AR (1): R2= 0,33
Modell ADR (1,1): R2= 0,40
R2 för modell ADR (1,1) är högre än R2 av AR-modellen (1). Detta innebär att ange den oberoende variabelnspårt-1 i regressionen hjälper det oss att bättre passa vår förutsägelse.