Kendall's Tau (II) - Vad det är, definition och koncept

Det är ett icke-parametriskt beroendemått som identifierar de överensstämmande och diskordanta paren av två variabler. När de väl identifierats beräknas totalen och kvoten görs.

Med andra ord tilldelar vi en ranking till observationerna av varje variabel och studerar beroendeförhållandet mellan två givna variabler.

Det finns två sätt att beräkna Kendalls Tau; vi väljer att beräkna beroendeförhållandet när observationerna för varje variabel har ordnats. I vårt exempel ser vi att vi sorterar rankningarna i kolumn X i stigande ordning.

Klassificerade korrelationer är ett icke-parametriskt alternativ som ett mått på beroende mellan två variabler när vi inte kan tillämpa Pearsons korrelationskoefficient.

Det här är resultaten som vi har hänvisat till i den första artikeln -> Kendalls Tau (I):

Skidort (i) X Z C NC
TILL 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
OCH 5 7 4 1
F 6 6 4 1
G 7 5 43 3 TOTAL
  • BC-CB-paret är ett diskordant par. Vi anger 1 i NC-kolumnen och fryser räknaren i den sista positionen tills vi hittar ett matchande par igen. I det här fallet har vi fryst antalet matchande par vid 5 upp till station D. Station D kan bara bilda fyra matchande par: AD-DA, DE-ED, DF-FD, DG-GD.

Ett annat motsägelsepar skulle vara EF-FE:

  • EF-FE-paret är ett diskordant par. Vi skriver 1 i NC-kolumnen och fortsätter att dra antalet 4 överensstämmande par som kan bildas. De matchande paren för station E skulle vara: EA-AE, EB-BE, EC-CE, ED-DE eftersom EF-FE är discordant.
    • FG-GF-paret är ett diskordant par. Vi skriver 1 i NC-kolumnen och fortsätter att dra antalet 4 överensstämmande par som kan bildas. De konkordanta paren för stationen F s (vi har inte varierat istället för 4. De konkordanta paren som vi kunde visa tidigare (vi har inte varierat skulle vara: FA-AF, FB-BF, FC-CF, FD-DF eftersom FG-GF skakar.

Vi beräknar Kendalls Tau

Kendalls Tau har ingen hemlighet utöver att vara kvoten för de överensstämmande och diskordanta paren av ett urval av observationer.

Tolkning

Vår första fråga var: Finns det ett beroende samband mellan utförsåkare och nordiska åkare på de angivna skidorterna?

I det här fallet har vi ett beroende mellan de två variablerna på 0,8695. Ett resultat mycket nära den övre gränsen. Resultatet visar att alpina skidåkare (X) och nordiska skidåkare (Z) har klassat orterna med liknande klassificeringar.

Utan att behöva göra någon form av beräkning kan vi se att de första stationerna (A, B, C) får de bästa poängen från de två grupperna. Med andra ord följer skidåkarnas betyg samma riktning.

Jämförelse: Pearson vs Kendall

Om vi ​​beräknar Pearsons korrelationskoefficient med tanke på tidigare observationer och jämför den med Kendalls Tau, får vi:

I det här fallet berättar Kendalls Tau att det finns ett starkare beroendeförhållande mellan variablerna X och Z jämfört med Pearsons korrelationskoefficient: 0,8695> 0,75.

Om avvikarna hade stort inflytande på resultaten, skulle vi hitta en stor skillnad mellan Pearson och Spearman och därför bör vi använda Spearman som ett mått på beroende.