En kvantil är den punkt som delar fördelningsfunktionen för en slumpmässig variabel i regelbundna intervall.
Därför är det inget annat än en statistisk teknik att separera data från en distribution. Naturligtvis måste det uppfyllas att grupperna är lika. Av denna anledning finns det olika typer av kvantiler, vilket vi kommer att se senare, beroende på antalet partitioner de gör.
De är extremt användbara i många praktiska tillämpningar, i exemplet visar vi en.
Kvantilberäkningsformulär
Kvantiteter kan beräknas ur parametrisk och icke-parametrisk synvinkel. Låt oss titta på både mer detaljerat och även den så kallade "kvantilfunktionen".
- Parametrisk: De används i distributioner vars form vi känner till. Det vill säga distributionen kommer att vara normal, enhetlig, exponentiell och så vidare. På detta sätt antas det att det är känt och dess huvudparametrar (aritmetiskt medelvärde och varians) också.
- Icke parametrisk: Den är lämplig för små prover där det är svårt att känna till dess exakta form och därför vet vi inte dess fördelningsfunktion. Denna metod ger liknande värden som den tidigare när provet ökar och därför är användningen av båda likgiltig.
- Kvantilfunktion: Vi står inför en sannolik beräkningsform. Målet är att beräkna ett värde som har en viss sannolikhet i en distributionsfunktion. Vi kommer inte att gå in på matematiska frågor som komplicerar konceptet.
Oftast kvantiler
Vi ska visa vilka som är de mest använda kvantilerna i statistiken. De flesta av dem används ofta för att kunna analysera i detalj distributionen av data. Dessutom är en annan av dess användningsområden att dela upp data i grupper, att kunna välja det högsta eller det lägsta. I exemplet kommer vi att se detta mer detaljerat.
- Kvartil: Separera värdena i fyra lika stora grupper och det finns tre kvartiler. Det är den vanligaste. Kvartil en (Q1) är den lägsta data och kvartil tre (Q3) är den högsta. Å andra sidan motsvarar kvartil två (Q2) medianen (Me) som är en positionsstatistik som delar fördelningen av data i hälften. Kvantilvärdena skulle vara 0,25 (Q1), 0,5 (Q2) och 0,75 (Q3).
- Quintile: I likhet med den föregående är den mindre frekvent och delar upp data i fem lika delar. Därför finns det fyra kvintiler. Kvantilvärdena skulle i detta fall vara 0,20, 0,40, 0,60, 0,80.
- Decil: I det här fallet är de uppdelade i tio delar och därför finns det nio deciler. Återigen är det inte heller så ofta. Deras värden skulle vara 0,1 till 0,9.
- Procentiler: Vi står inför en variant där fördelningen är uppdelad i hundra lika delar. Det kan vara av intresse för mycket stora prover. Deras värden varierar från 0,01 till 0,99.
Kvantiellt exempel
Låt oss titta på ett exempel där vi har en serie data om inkomsterna för invånarna i en viss kommun. Vi har beräknat de tre mest representativa kvartilerna och tre decilerna. Vi tar med de använda formlerna, med hänsyn till att vi använder deciler för ekvivalenter i percentiler. Kom ihåg att data i Q2 och D5 motsvarar medianen.
Vi kan konstatera att inkomsterna för individer som representerar de minst gynnade 25% (Q1) är 2 900. I förhållande till decilen är inkomsten för de 10% (D1) för de personer som får minst 2800. Samma tolkning görs med överordnade, men i omvänd ordning. De 25% (Q3) som tjänar mest får en inkomst på 4 100 och 10% av 4 800. Kvantilen återspeglar därför relevant information för att lära dig mer om en variabel.