Bayesian informationskriterium

Bayesian-informationskriteriet eller Schwarz-kriteriet är en metod som fokuserar på summan av resterna för att hitta antalet fördröjda perioder sid som minimerar den här modellen.

Med andra ord vill vi hitta det minsta antalet fördröjda perioder som vi inkluderar i autoregressionen för att hjälpa oss med förutsägelsen av den beroende variabeln.

På detta sätt kommer vi att ha kontroll över antalet fördröjda perioder sid som vi inkluderar i regressionen. När vi överskrider denna optimala nivå slutar Schwarz-modellen att minska och därför har vi nått det lägsta. Det vill säga, vi kommer att ha nått antalet fördröjda perioder sid som minimerar Schwarz-modellen.

Det kallas också Bayes Information Criterion (BIC).

Rekommenderade artiklar: autoregression, summan av kvadraterna av rester (SCE).

Bayesian Information Criterion Formula

Även om det vid första anblicken verkar vara en komplicerad formel, kommer vi att gå igenom delar för att förstå den. Först och främst måste vi på ett allmänt sätt:

  • Logaritmerna i båda faktorerna med formeln representerar den marginella effekten av att inkludera en fördröjd period sid mer i självregression.
  • N är det totala antalet observationer.
  • Vi kan dela formeln i två delar: vänster del och höger del.

Delen till vänster:

Representerar summan av kvadraterna för resterna (SCE) av autoregressionen avsid fördröjda perioder dividerat med det totala antalet observationer (N).

För att uppskatta koefficienterna använder vi vanliga minsta kvadrater (OLS). Så när vi inkluderar nya fördröjda perioder kan SCE (p) bara bibehållas eller minskas.

Sedan orsakar ökningen av en fördröjd period i autoregressionen:

  • SCE (p): minskar eller förblir konstant.
  • Bestämningskoefficient: ökar.
  • TOTAL EFFEKT: en ökning under en fördröjd period orsakar en minskning av den vänstra delen av formeln.

Nu rätt del:

(p + 1) representerar det totala antalet koefficienter i autoregressionen, det vill säga regressorerna med sina fördröjda perioder (sid) och avlyssningen (1).

Sedan orsakar ökningen av en fördröjd period i autoregressionen:

  • (p + 1): ökar eftersom vi införlivar en fördröjd period.
  • TOTAL EFFEKT: en ökning under en fördröjd period orsakar en ökning av den högra delen av formeln.

Praktiskt exempel

Vi antar att vi vill göra en förutsägelse om priserna påliftkort för nästa säsong 2020 med ett 5-årigt urval men vi vet inte hur många fördröjningsperioder som ska användas: AR (2) eller AR (3)?

  • Vi laddar ner data och beräknar de naturliga logaritmerna för priserna på liftkort.

1. Vi uppskattar koefficienterna med OLS och får:

Summan av kvadraterna av restprodukter (SCE) för AR (2) = 0,011753112

Bestämningskoefficient för AR (2) = 0,085

2. Vi lägger till ytterligare 1 fördröjd period för att se hur SCE förändras:

Summan av kvadraterna för rester för AR (3) = 0,006805295

Bestämningskoefficient för AR (3) = 0,47

Vi kan se att när vi lägger till en fördröjd period i autoregressionen ökar bestämningskoefficienten och SCE minskar i detta fall.

  • Vi beräknar det Bayesiska informationskriteriet:

Ju mindre BIC-modellen är, desto mer föredras modellen. Då skulle AR (3) vara den föredragna modellen med avseende på AR (2) med tanke på att dess bestämningskoefficient är högre, SCE är lägre och Schwarz-modellen eller Bayesian-informationskriteriet också är lägre.