Kategorisk variabel - Vad är det, definition och koncept

Innehållsförteckning:

Kategorisk variabel - Vad är det, definition och koncept
Kategorisk variabel - Vad är det, definition och koncept
Anonim

En kategorisk variabel är en som gör det möjligt att klassificera en serie data med hjälp av fasta värden associerade med en specifik kvalitet eller kategori.

Den kategoriska variabeln klassificerar individer eller fall till skillnad från huvud- eller kontinuerliga variabler (som tillåter numeriska beräkningar). De tar normalt värden som representeras av heltal, som en eller noll, men det är just det, representationer.

I exemplet kommer vi att se det mer detaljerat.

Skillnader mellan kategorisk och kontinuerlig variabel

Det finns vissa skillnader mellan den kategoriska variabeln och den kontinuerliga eller huvudvariabeln som borde vara kända. Låt oss se det mest relevanta.

  • Först används den kategoriska variabeln för gruppering och den kontinuerliga variabeln för att räkna. Med andra ord tillåter den första att kategorier skapas med en serie data. Till exempel kön eller antal barn. Den andra ger oss numerisk information. Till exempel ålder.
  • Kardinalvariabeln tillåter numeriska beräkningar, de andra inte. På det här sättet kan vi i det förra känna till medel eller avvikelser, medan i de andra bara en del data, såsom läget eller andelen kategorier.
  • De kategoriska är mycket användbara för att känna till kvalitativ information, det vill säga viss datakvalitet. De kontinuerliga ger oss kvantitativa data, det vill säga kvantiteter och värden som representeras av siffror.

Statistiska tekniker för kategoriska variabler

Låt oss sedan se de statistiska tekniker som används mest i kategoriska variabler, jämför dem med de för kontinuerliga eller kardinalvariabler.

  • Beskrivande statistik: I denna typ av variabler baseras analyserna vanligtvis på bland annat stapel- och procentdiagram. Kardinaler tillåter tillämpning av analystekniker för att beräkna positionsstatistik som kvantiler, eller dispersionsstatistik såsom avvikelser.
  • Hypotes kontrast: I kategorin kan resultaten extrapoleras med hjälp av icke-parametriska hypotesprov. Å andra sidan använder de kontinuerliga parametriska kontraster som också kan härledas.
  • Regressionstekniker: I det här fallet används bland annat logistisk regression eller liknande för det förra. För den andra typen av variabler är den mest använda tekniken linjär regression.

Exempel på kategorisk variabel

För att avsluta, låt oss titta på ett mycket vanligt exempel inom marknadsföring. Låt oss föreställa oss att vi vill sälja en produkt och vi är intresserade av att få veta civilståndet.

För att göra detta tilldelar vi 1 till singel, 2 till gif.webpt, 3 till frånskilda, 4 till partner och 5 till andra.

Låt oss se bilden och sedan kommentera den:

I den kan vi se att den högsta andelen individer är ensamstående, gif.webpta och frånskilda, med de andra två alternativen bara 5%.

Som vi kan se är kategoriska variabler användbara för gruppering. Stapeldiagrammet gör att vi bättre kan observera dessa procentsatser, eftersom det är lättare att jämföra staplarnas storlek.