Enkel autokorrelationsfunktion - Exempel i R

Innehållsförteckning:

Enkel autokorrelationsfunktion - Exempel i R
Enkel autokorrelationsfunktion - Exempel i R
Anonim

Med andra ord, Simple Autocorrelation Function (FAS), eller från engelska, Autokorrelationsfunktion, Det är en matematisk funktion som hjälper oss att veta hur beroende en viss tids data har av samma data från k tidigare perioder.

Vi genererar en årlig tidsserie X som följer en normalfördelning plus en tröghet. Vi kan också använda riktiga data.

Metodik

Program är väsentliga för att arbeta med autokorrelationsanalysen. Program som Python kan användas, men för statistisk analys och datahantering rekommenderar vi R, eller dess förbättrade version, R Studio. Här kommer vi att arbeta med R.

Beräkning

Och hur skriver vi FAS-formeln i R-kod?

Både R och Python har bibliotek där formler är länkade till ett namn. Då räcker det att vi har installerat biblioteket som innehåller formeln som vi vill använda och kallar det i skriptet.

I frågan om R måste vi skriva:

Funktionen acf det är inne i biblioteket statistik.

X -> Tidsserier som vi använder som ett exempel för att beräkna FAS.

acf (X, ylim = c (-1,1)) -> Enkel autokorrelationsfunktion på X med gränser på den vertikala axeln mellan -1 och 1, vilka är de värden som autokorrelationskoefficienten kan ta.

Verifiering

Det här steget är inte nödvändigt om vi har använt den tidigare koden eftersom den beräknar själva konfidensbanden.

För att avgöra om de beräknade autokorrelationskoefficienterna är statistiskt signifikanta måste vi fastställa konfidensband med de kritiska värdena. På detta sätt kan vi, med tanke på en procentandel av betydelse, med statistisk säkerhet säga om det finns förekomst av autokorrelation i data.

På samma sätt som korrelationskoefficienten antar autokorrelationskoefficienten också normalitet och därför beräknar vi konfidensintervallet enligt följande:

Vi definierar hypotesprovning som:

Vid 95% konfidens med en signifikansnivå på 5% hittar vi den berömda 1,96 i de normala tabellerna. Kritiskt värde ges av:

Där koefficiensernas varians ges av approximationen:

Även om vi ger formeln rekommenderar vi att du använder statistiska program för större precision och snabbhet.

Resultat

Alla rader som slutar utanför konfidensintervallet innebär att tidsserien uppvisar autokorrelation under den angivna perioden.

Så baserat på grafen ser vi att det finns närvaro av autokorrelation i denna tidsserie under de perioder som linjen sticker ut från det diskontinuerliga bandet.

Den första raden som är vid 0 och avfyrar mot 1 kan ignoreras eftersom t måste vara strikt större än 0 och i detta fall är det inte. Det är inte mycket meningsfullt att behöva göra alla tidigare steg för att känna till autokorrelationen nu med nu eftersom vi redan vet det: korrelationen mellan en variabel och sig själv är 1, så vi har redan svaret.