Box Plot - Vad är det, definition och koncept

Innehållsförteckning:

Box Plot - Vad är det, definition och koncept
Box Plot - Vad är det, definition och koncept
Anonim

En boxplot, från engelska, boxplot, är en representation av en kvantitativ eller kategorisk variabel i syfte att snabbt identifiera datamängdenas kvartiler.

Med andra ord är en boxplot ett diagram som representerar en kvantitativ eller kvalitativ variabel genom kvartilerna.

I statistik är det ett användbart verktyg för att representera både diskreta och kontinuerliga datamängder.

Det är viktigt att komma ihåg att de kvalitativa variabla variablerna eller som är avsedda att representera en ordning eller en kategori alltid måste kopplas till ett numeriskt index större än 0 så att de kan visas i diagrammet och motsvarande statistik kan beräknas.

Ruta och histogram

En ruttdiagram är inget annat än ett histogram sett ovanifrån, och på samma sätt är ett histogram en ruttdiagram sett från sidan. Ett exempel kan ses nedan.

Den första egenskapen som båda diagrammen delar är minsta och högsta av datamängden. Ändstängerna efter bindestrecken anger minimum (nedre stapel) och maximal (övre stapel). Avvikare skulle representeras utanför gränsen för max och minimum. Det vill säga bortom staplarna efter bindestrecken. Vi kan också hitta horisontella rutor.

Med en överblick kan du se att de flesta uppgif.webpterna är centrerade om observationerna nära det minsta i båda graferna. Detta indikeras av rutan där rutan är närmare det lägsta än det maximala. Om vi ​​tittar på histogrammet, kommer vi att se att de vanligaste observationerna är observationerna som är nära det minsta och långt från det maximala.

Box plot information

Informationen i rutan är följande:

  1. Lådans botten är den första kvartilen (Q1).
  2. Stapeln mitt i rutan är median- eller andra kvartilen (Q2).
  3. Överst på rutan är den tredje kvartilen (Q3).
  4. Interkvartilintervallet eller IQR skulle vara lådans höjd, det vill säga skillnaden mellan Q3 och Q1.

Box-plotnyckel

Denna grafiska representation kallas en ruttdiagram eftersom den ser ut som en ruta. För att komma ihåg den här grafen måste vi därför bara tänka på ett fyrkantigt objekt eller en ruta.

För läsare som är bekanta med priset på finansiella tillgångar kommer de att se mer likhet med ett ljus. Ljusen som du ser i offerten är kartritningar anpassade till det valda tidsfönstret.

För- och nackdelar med lådan

Bland fördelarna och nackdelarna med detta diagram hittar vi följande:

Fördel

  • Globaliserad vision av den absoluta frekvensen för en kvantitativ eller kvalitativ variabel.
  • Kunskap om minsta, maximala och kvartiler för datamängden utan att behöva beräkna dem.
  • Erkännande av extrema värden snabbare än med ett histogram eftersom extrema värden indikeras med cirklar utanför maximum och minimum.

Nackdelar

  • Om datauppsättningen är liten blir det svårare att förstå att göra en rutt för att uttrycka dessa data.

Exempel på rutan

Vi antar att vi vill representera antalet cyklister som passerar vårt hus under ett år. Först räknar vi cyklisterna och samlar in informationen i en tabell.

Genom vissa program som R eller Excel kan vi generera grafen som visas nedan.

Tack vare att vi representerar antalet cyklister genom rutan, kan vi snabbt intuitera var medianen är, de andra kvartilerna, max och minimum. I det här fallet har vi inte atypiska data, eftersom det finns utöver det maximala och minimala.

Tillämpningen av denna typ av diagram är mycket vanlig med tanke på dess enkelhet och användbarhet inom många områden utöver ekonomi och ekonomi.