Variationskoefficient - Vad är det, definition och mening
Variationskoefficienten, även känd som Pearson's variationskoefficient, är ett statistiskt mått som informerar oss om den relativa spridningen av en datamängd.
Det vill säga, det informerar oss, som andra mått på spridning, om en variabel rör sig mycket, lite, mer eller mindre än en annan.
Formel för variationskoefficient
Dess beräkning erhålls genom att dividera standardavvikelsen med det absoluta värdet av uppsättningens medelvärde och uttrycks vanligtvis i procent för bättre förståelse.

- X: variabel som variansen ska beräknas på
- σx: Standardavvikelse för variabel X.
- | x̄ |: Det är medelvärdet av variabeln X i absolut värde med x̄ ≠ 0
Variationskoefficienten kan ses med bokstäverna CV eller r, beroende på bruksanvisningen eller teckensnittet. Dess formel är följande:
Variationskoefficienten används för att jämföra datamängder som tillhör olika populationer. Om vi tittar på dess formel ser vi att den tar hänsyn till medelvärdet. Därför tillåter variationskoefficienten att vi har ett dispersionsmått som eliminerar de möjliga snedvridningarna av medel för två eller flera populationer.
RangExempel på användning av variationskoefficienten istället för standardavvikelsen
Här är några exempel på denna mått på spridning:
Jämförelse av datamängder med olika dimensioner
Vi vill köpa spridningen mellan höjden på 50 elever i en klass och deras vikt. För att jämföra höjden kan vi använda meter och centimeter som måttenhet och kilo för vikt. Att jämföra dessa två fördelningar med hjälp av standardavvikelsen vore inte meningsfullt eftersom vi försöker mäta två olika kvalitativa variabler (ett mått på längd och en på massa).
Jämför uppsättningar med stor skillnad mellan medel
Föreställ dig till exempel att vi vill mäta vikten på skalbaggar och flodhästar. Skalbaggarnas vikt mäts i gram eller milligram och flodhästens vikt mäts vanligtvis i ton. Om vi för vår mätning omvandlar skalbaggarnas vikt till ton så att båda populationerna är i samma skala, skulle det inte vara lämpligt att använda standardavvikelsen som ett mått på dispersion. Medelvärdet av skalbaggen uppmätt i ton skulle vara så liten att om vi använde standardavvikelsen skulle det knappast finnas någon dispersion i data. Detta skulle vara ett misstag eftersom vikten mellan olika arter av skalbaggar kan variera avsevärt.
Exempel på beräkning av variationskoefficienten
Tänk på en population av elefanter och en annan av möss. Elefantpopulationen har en medelvikt på 5 000 kg och en standardavvikelse på 400 kg. Muspopulationen har en medelvikt på 15 gram och en standardavvikelse på 5 gram. Om vi jämför dispersionen av båda populationerna med standardavvikelsen kanske vi tror att det finns större dispersion för populationen av elefanter än för möss.
Men när vi beräknar variationskoefficienten för båda populationerna skulle vi inse att det är tvärtom.
Elefanter: 400/5000 = 0,08
Möss: 5/15 = 0,33
Om vi multiplicerar båda data med 100 har vi att variationskoefficienten för elefanter bara är 8%, medan mössen är 33%. Som en konsekvens av skillnaden mellan populationerna och deras genomsnittliga vikt ser vi att befolkningen med störst spridning inte är den med den största standardavvikelsen.
KonfidensintervallLinjär korrelationskoefficient