Varians är ett mått på dispersion som representerar variationen i en dataserie med avseende på dess medelvärde. Formellt beräknas det som summan av de kvadrerade resterna dividerat med det totala antalet observationer.
Det kan också beräknas som standardavvikelsen i kvadrat. Förresten förstår vi rest som skillnaden mellan värdet på en variabel åt gången och medelvärdet för hela variabeln.
Se alla mått på spridningInnan vi tittar på variansformeln måste vi säga att avvikelsen i statistik är mycket viktig. Eftersom det är ett enkelt mått kan det ge mycket information om en viss variabel.
Formel för att beräkna variansen
Måttenheten för variansen kommer alltid att vara den måttenhet som motsvarar data men i kvadrat. Variansen är alltid större än eller lika med noll. Eftersom resterna är kvadrerade är det matematiskt omöjligt för variansen att bli negativ. Och på det sättet kan det inte vara mindre än noll.
Var
- X: variabel som variansen ska beräknas på
- xi: observationsnummer i för variabel X. Jag kan ta värden mellan 1 och n.
- n: antal observationer.
- x̄: Det är medelvärdet av variabeln X.
Eller vad är detsamma:
Varför är resterna i kvadrat?
Anledningen till att resterna är kvadrerade är enkel. Om de inte var kvadrerade skulle summan av rester vara noll. Det är en avfallsegenskap. Så för att undvika detta, som med standardavvikelsen, är de kvadratiska. Resultatet är den måttenhet där data mäts men kvadreras.
Om vi till exempel hade uppgif.webpter om lönerna för en uppsättning människor i euro, skulle de data som ger avvikelsen vara i kvadrat euro. För att tolkningen ska vara meningsfull beräknar vi standardavvikelsen och överför data till euro.
- Avvikelse -> (2-3) = -1
- Avvikelse -> (4-3) = 1
- Avvikelse -> (2-3) = -1
- Avvikelse -> (4-3) = 1
- Avvikelse -> (2-3) = -1
- Avvikelse -> (4-3) = 1
Om vi lägger till alla avvikelser är resultatet noll.
RangVad är skillnaden mellan variansen och standardavvikelsen?
En fråga som skulle kunna ställas och med goda skäl skulle vara skillnaden mellan varians och standardavvikelse. I verkligheten kommer de att mäta samma sak. Variansen är standardavvikelsen i kvadrat. Eller tvärtom är standardavvikelsen kvadratroten av variansen.
Standardavvikelsen är gjord för att kunna arbeta i de första måttenheterna. Naturligtvis kan man undra, vad är nyttan av att ha varians som begrepp? Tja, även om tolkningen av värdet som den returnerar inte ger oss mycket information är dess beräkning nödvändig för att erhålla värdet av andra parametrar.
För att beräkna kovariansen behöver vi variansen och inte standardavvikelsen, för att beräkna några ekonometriska matriser används variansen och inte standardavvikelsen. Det är en fråga om komfort när man arbetar med data enligt vilka beräkningar.
Exempel på variansberäkning
Vi kommer att mynta en serie data om löner. Vi har fem personer, var och en med olika löner:
Juan: 1 500 euro
Pepe: 1200 euro
José: 1700 euro
Miguel: 1300 euro
Mateo: 1800 euro
Den genomsnittliga lönen, som vi behöver för vår beräkning, är ((1 500 + 1 200 + 1 700 + 1 300 + 1 800) / 5) 1 500 euro.
Eftersom variansformeln i dess uppdelade form formuleras enligt följande:
Vi kommer att få att det måste beräknas så att:
Resultatet är 52 000 euro i kvadrat. Det är viktigt att komma ihåg att när vi beräknar variansen har vi måttenheterna i kvadrat. För att konvertera det till euro skulle vi i det här fallet behöva utföra standardavvikelsen. Det ungefärliga resultatet skulle vara 228 euro. Detta innebär att skillnaden mellan de olika personernas löner i genomsnitt blir 228 euro.