Kvartilavvikelse - Vad det är, definition och koncept

Innehållsförteckning:

Kvartilavvikelse - Vad det är, definition och koncept
Kvartilavvikelse - Vad det är, definition och koncept
Anonim

Kvartilavvikelse är ett statistiskt mått på spridning som returnerar det interna kvartilintervallets centrala värde och används i snedställda datamängder.

Med andra ord är kvartilavvikelsen att beräkna medianen för intervallintervallet (IQR) och används i datamängder med en hel del extrema värden.

Kortformen för kvartilavvikelse är DQ.

Kvartilavståndet

Interkvartilintervallet är ett mått på spridning av en datamängd som vanligtvis används i rutan. Interkvartilintervallet är med andra ord skillnaden mellan den näst sista och de första kvartilerna i en distribution som används i rutan.

IQR = Q3 - Q1

Fördelen med att använda interkvartilintervallet är att kvartilavvikelsen (DQ) kan beräknas, vilket är ett mycket adekvat mått på dispersion när vi har partiska datamängder.

Kvartilavvikelseformel

Kvartilavvikelsen beräknas som delningen av interkvartilområdet med 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Eftersom vi bara tar hänsyn till spridningen mellan tredje och första kvartilen ignorerar vi all data utanför det intervallet. Och därför är alla värden nära att vara extrema. Så om vi delar interkvartilintervallet med två kommer vi att få medianvärdet för dispersionen.

Exempel på kvartilavvikelse

Vi antar att vi vill beräkna interkvartilområdet och kvartilavvikelsen för antalet cyklister som passerar vårt hus under året.

  1. Först räknar vi cyklisterna och samlar in informationen i en tabell.
  1. För det andra beräknar vi de första och tredje kvartilerna för att erhålla interkvartilintervallet.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550-200 = 350

  1. För det tredje beräknar vi kvartildispersionen genom att helt enkelt dela interkvartilområdet med två.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Kvartilspridningen för denna datamängd är 175. Detta tal är det centrala värdet för intervallet för kvartalet.

Det är viktigt att notera att uppgif.webpterna för juli månad är extrema data eftersom de är flera gånger högre än all annan data. Så vi kan säga att denna datamängd är partisk mot den månaden. Tack vare "okunskapen" om kvartilens spridning mot extrema data, är resultatet av denna åtgärd mycket lika om bara 600 cyklister cirkulerade i juli. Om det bara fanns 600 cyklister i juli skulle kvartilens spridning vara 162,5, mycket nära 175 med tanke på att antalet cyklister den månaden är tio gånger mindre.