Spearman's Rho - Vad är det, definition och koncept

Innehållsförteckning:

Anonim

Spearmans rho är ett icke-parametriskt beroendemått där medelhierarkin för observationerna beräknas, skillnaderna kvadreras och införlivas i formeln.

Med andra ord tilldelar vi en ranking till observationerna av varje variabel och studerar beroendeförhållandet mellan två givna variabler.

Klassificerade korrelationer är ett icke-parametriskt alternativ som ett mått på beroende mellan två variabler när vi inte kan tillämpa Pearsons korrelationskoefficient.

I allmänhet tilldelas bokstaven giega rho till korrelationskoefficienten.

Spearmans rho-uppskattning ges av:

Rho Spearman-förfarande

0. Vi börjar med ett urval av n observationer (Ai, Bi).

1. Klassificera observationerna för varje variabel och justera dem för band.

  • Vi använder en excel-funktion som klassificerar observationerna för oss och justerar dem automatiskt om den hittar band mellan elementen. Denna funktion kallas HERARCH.MEDIA (klass Ai; En klassificeringn;ordning).
  • Den sista faktorn för funktionen är valfri och berättar i vilken ordning vi vill beställa observationerna. Ett icke-nollnummer sorterar observationerna i stigande ordning. Till exempel kommer det att tilldela det minsta elementet en rangordning på 1. Om vi ​​sätter en noll i variabeln ordning, tilldelar det största objektet en rangordning på 1 (fallande ordning).

Praktiskt exempel

  • I vårt fall tilldelar vi ordningsvariabeln ett icke-nollnummer för att ordna observationerna i stigande ordning. Det vill säga att tilldela det minsta elementet i variabeln en rangordning på 1.
  • Vi kontrollerar att de totala summan av kolumnerna för Klassificering A Y Klassificering B de är lika med varandra och möts:

I det här fallet är n = 10 eftersom vi har totalt 10 element / observationer i varje variabel TILL Y B.

Den totala summan av klassificering A är lika med den totala summan av klassificering Y och de uppfyller också ovanstående formel.

TILL B Klassificering A Klassificering B Kvadratiska skillnader
0 50 2,5 8,5 36
70 -20 9 3 36
-20 30 1 6,5 30,25
40 -90 6 1 25
30 0 5 4 1
50 30 7 6,5 0,25
20 20 4 5 1
0 -40 2,5 2 0,25
80 70 10 10 0
60 50 8 8,5 0,25
Total 55 55 130

2. Lägg till skillnaderna mellan rankningarna och kvadratera dem.

  • När vi väl har alla klassificerade observationer med hänsyn till banden mellan dem beräknar vi skillnaden i form:

di = Ai - Bi

Vi definierar (di) som skillnaden mellan klassificeringen av A.i och klassificeringen av Bi.

  • När skillnaden har uppnåtts kvadrerar vi den. Kvadraternas kvadrater tillämpas för att bara ha positiva värden.

Vi definierar di2 som den kvadratiska skillnaden mellan klassificeringen av A.i och klassificeringen av Bi.

I kolumnen med kvadratiska skillnader kommer vi att ha:

di2 = (Ai - Bi)2

3. Beräkna Spearmans rho:

  • Vi beräknar den totala summan av de kvadratiska skillnaderna i formen:

I vårt exempel:

  • Vi införlivar resultatet i Spearmans rho-formel:

I vårt exempel:

Jämförelse: Pearson vs Spearman

Om vi ​​beräknar Pearsons korrelationskoefficient med tanke på tidigare observationer och jämför den med Spearmans korrelationskoefficient får vi:

  • Pearson = 0.1109
  • Spearman = 0.2121

Vi kan se att beroendet mellan variablerna A och B förblir svagt även om vi använder Spearman istället för Pearson.

Om avvikarna hade stort inflytande på resultaten, skulle vi hitta en stor skillnad mellan Pearson och Spearman och därför bör vi använda Spearman som ett mått på beroende.