Kendalls Tau (I) - Vad det är, definition och koncept

Innehållsförteckning:

Kendalls Tau (I) - Vad det är, definition och koncept
Kendalls Tau (I) - Vad det är, definition och koncept
Anonim

Det är ett icke-parametriskt beroendemått som identifierar de överensstämmande och diskordanta paren av två variabler. När de väl identifierats beräknas totalen och kvoten görs.

Klassificerade korrelationer är ett icke-parametriskt alternativ som ett mått på beroende mellan två variabler när vi inte kan tillämpa Pearsons korrelationskoefficient.

Med andra ord tilldelar vi en ranking till observationerna av varje variabel och studerar beroendeförhållandet mellan två givna variabler. Det finns två sätt att beräkna Kendalls Tau; vi väljer att beräkna beroendeförhållandet när observationerna för varje variabel har ordnats. I vårt exempel ser vi att vi har sorterat rankningarna i kolumn X i stigande ordning.

Matematiskt,

Vi definierar:

Cn = totalt antal matchande par.

NCn = totalt antal icke-överensstämmande (diskordanta) par.

Förfarande och praktiskt exempel

För att få Kendalls Tau måste vi först veta hur man identifierar de överensstämmande och diskordanta paren av två variabler.

Vi använder skidåkarnas preferenser. I det här exemplet antar vi att vi vill utvärdera om skidåkarna klassificerar sina preferenser för alpint eller nordiskt i samma ordning på en station i. Deras betyg kan variera från 1 (mycket att föredra) till 7 (mycket lite att föredra).

Vår fråga skulle vara: finns det ett beroende mellan preferenser för utförsåkning och nordiska åkare på de angivna skidorterna?

Vi definierar:

X = betyg för skidåkare för alpin skidåkning i station i.

Y = bedömning av skidåkarna för nordisk skidåkning på station i.

C = överensstämmande par.

NC = felaktiga / diskordanta par.

OCHi = skidort i.

Bearbeta

  • Vi utgår från ett urval av n = 7 observationer av skidorter. Varje rad i tabellen är klassificeringar från skidåkarna. Varje par stationer kan vara överensstämmande eller överensstämmande. I kolumnerna C och NC räknar vi bara paren i en riktning. Till exempel räknas paret AB och BA som ett enda par för att undvika repetitioner.

De erhållna observationerna är:

Skidort (i) X Z
TILL 1 1
B 2 3
C 3 4
D 4 2
OCH 5 7
F 6 6
G 7 5
  1. Vi har sorterat elementen i kolumn X i stigande ordning för att kunna jämföra dem med elementen i kolumn Z
  2. Vi hittar de överensstämmande paren och de överensstämmande paren.
Skidort (i) X Z CNC
TILL 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
OCH 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Total
  • Först tittar vi på kolumn Z eftersom kolumn X redan är sorterad i stigande ordning. Följaktligen kommer alla klassificeringar i kolumn Z som inte är stigande att vara diskordanta stationspar.
    • När vi letar efter par stationer (överensstämmande och icke-överensstämmande) kommer vi alltid att ha den sista raden av observationer eftersom vi letar efter par (uppsättningar med två observationer).
    • Alla som ligger under en referensklassificering kommer att vara överensstämmande par. I det första fallet fastställer båda skidåkarna den referensklassificeringen vid 1. Alla klassificeringar under 1 kommer att vara par i överensstämmelse med A. Totalt har vi 7 stationer att klassificera. Så det kommer att finnas 6 överensstämmande par av A. Eftersom vi inte har några avvikande par associerade med A, kommer vi att sätta noll.

Läs andra delen av Kendall's Tau (II)