Statistisk normalisering - Vad det är, definition och koncept

Innehållsförteckning:

Anonim

Statistisk normalisering är skaltransformationen av fördelningen av en variabel för att kunna göra jämförelser med avseende på uppsättningar av element och medelvärdet genom att eliminera effekterna av influenser.

Med andra ord är normalisering proportioner utan måttenheter (måttlös eller skalbar) som gör att vi kan jämföra element av olika variabler och olika måttenheter.

I statistik och ekonometri används standardiserade sannolikhetsfördelningstabeller för att hitta sannolikheten att en observation tar med tanke på den fördelningsfunktion som variabeln följer.

Det är viktigt att inte begränsa normaliseringsperioden endast till uppsättningar av element där normalfördelningen är en god approximation till deras frekvens.

Statistisk variabel

Tabell

Följande tabell beskriver de vanligaste standardiseringarna i statistik som tillämpas på ekonomi och ekonomi.

  • Den typiserade eller standardpoängen normaliserar felen när vi kan beräkna provparametrarna.
  • Normaliseringen i studentens t-fördelning normaliserar resterna när parametrarna är okända och vi gör en uppskattning för att erhålla dem.
  • Variationskoefficienten använder medelvärdet som ett skalmått, till skillnad från den standardiserade poängen och Studentens t, som använder standardavvikelsen. Fördelningen normaliseras för Poisson- och exponentiella distributioner.
  • Det standardiserade momentet kan tillämpas på alla sannolikhetsfördelningar som har en momentgenererande funktion. Med andra ord, att ögonblickens integraler är konvergerande.

Applikationer

Hur många gånger har vi läst att den normala sannolikhetsfördelningen verkar som en tillräckligt bra approximation till observationsfrekvensen och vi ombeds att hitta sannolikheten att variabeln X tar ett specifikt värde?

Med andra ord ställer vi in ​​X ~ N (μ, σ2), och vi ombeds att hitta P (X ≤ xi)

Vi vet att för att hitta P (X ≤ xi), måste vi slå upp sannolikheten i sannolikhetsfördelningstabellerna. I detta fall i tabellerna över fördelningen av normalfördelningen. De mest använda sannolikhetsfördelningstabellerna i ekonometri och kvantitativ ekonomi är: chi-kvadrat, Studentens t, Fisher-Snedecors F, Poisson, exponential, cauchy och standardnormalen.

Sannolikheterna som beräknas i distributionstabellerna uppfyller egenskapen:

Det vill säga sannolikheterna (siffrorna i tabellen) typiseras. Då måste vi också skriva vår variabel enligt fördelningsfunktionens parametrar om vi vill hitta sannolikheten för P (X ≤ xi).

Praktiskt exempel

Vi vill veta sannolikheten för att antalet skidåkare som åker på fredag ​​morgon är 288.

Skidorten berättar för oss att frekvenserna hos skidvariabeln kan approximera en normalfördelning av medelvärdet 280 och varians 16.

Så vi har:

X ~ N (μ, σ2)

där X definieras som variabeln "skidåkare"

De ber oss om sannolikheten att antalet skidåkare som åker på fredag ​​är mindre än eller lika med 288. Det vill säga:

P (X ≤ 288)

Bearbeta

För att hitta sannolikheten för att antalet åkare är lika med 288 måste vi först skriva variabeln.

Sedan tittar vi på distributionstabellen för den kontinuerliga standardnormalen:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

Sannolikheten för att 288 skidåkare åker på fredag ​​morgon är 97,72% med tanke på medel- och variansparametrarna.