ضریب همبستگی رتبه‌ای اسپیرمن

از testwiki
پرش به ناوبری پرش به جستجو
زمانی که رابطهٔ بین دو متغیر یکنوا باشد، اگرچه غیر خطی، ضریب همبستگی اسپیرمن ۱ است. ولی در این شرایط ضریب همبستگی پیرسون کامل ۱ نمی‌شود.

ضریب همبستگی رتبه‌ای اسپیرمن [۱] آماره‌ای ناپارامتری برای سنجش ضریب همبستگی بین دو متغیر تصادفی است. این ضریب را معمولاً با ρ یا rs نشان می‌دهند.

بیان آماری

مقدار ضریب همبستگی رتبه‌ای اسپیرمن مبین قابلیت بیان یک متغیر به صورت تابعی یکنوا از متغیر دیگر است. همبستگی کامل پیرسون (۱+ یا ۱-) در جاییست که متغیری تابعی یکنوا از متغیر دیگر باشد. صفر بودن این ضریب دلیل استقلال متقابل است. لازم به ذکر است که از ضریب اسپیرمن تنها در شرایطی استفاده می‌شود که دادههای ورودی رتبه‌ای باشند. روش های دیگری مانند تای کندال را می توان به‌جای ضریب همبستگی اسپیرمن استفاده نمود که همانند روش اسپیرمن یک روش ناپارامتری محسوب می شود.

اگر n زوج داده به صورت (Xi,Yi) داده شده‌باشند و رتبهٔ هر داده را به صورت (xi,yi) تعریف کنیم، ضریب اسپیرمن از طریق فرمول زیر محاسبه می گردد[۲][۳]:

rs=16di2n(n21)

بطوریکه مقدار di بیانگر فاصله بین دو رنک در مشاهدات است که از طریق فرمول di=R(xi)R(yi) محاسبه می گردد و n بیانگر تعداد مشاهدات است.

همچنین، این ضریب را می‌توان به صورت ضریب همبستگی پیرسون بین داده‌های رتبه‌بندی شده تعریف کرد. به عنوان مثال، اگر n زوج داده به صورت (Xi,Yi) داده شده‌باشند، ابتدا رتبهٔ هر داده را به صورت (xi,yi) حساب کرده و سپس ضریب همبستگی اسپیرمن را به صورت زیر حساب می‌کنیم:

ρ=i(xix¯)(yiy¯)i(xix¯)2i(yiy¯)2

به داده‌های تکراری مقدار میانگین رتبه‌ها را اختصاص می‌دهیم. جدول زیر مثالی از محاسبهٔ رتبه را نشان می‌دهد:

Variable Xi Position in the ascending order Rank xi
۰٫۸ ۱ ۱
1.2 2 2+32=2.5 
1.2 3 2+32=2.5 
۲٫۳ ۴ ۴
۱۸ ۵ ۵


فرض کنید دو سری دیتا رتبه ای به‌صورت جدول زیر وجود دارد. می خواهیم مقدار ضریب اسپیرمن را برای این دیتاها محاسبه نماییم.

yi xi
1 1
2 3
3 2

مقدار ضریب اسپیرمن برای این دو سری دیتا 0.5 خواهد بود که بیانگر مشابهت آنها می باشد. نحوه محاسبه ضریب اسپیرمن به‌صورت زیر است:


rs=16di2n(n21)=16*((11)2+(32)2+(23)2)3(321)=0.5

نمونه کد ساده

در متلب، تابع corr برای این منظور است؛ مثلاً در کد زیر: الگو:چپ‌چین N=5; % No. of nodes

x = randn(N,1); y = randn(N,1);

[r,p] = corr(x,y,'type','Spearman');

z(N,2)=0; z(:,1)=x(:,1);z(:,2)=y(:,1);z2=sortrows(z,1);zx=z2(:,1);zy=z2(:,2);

fprintf(' Spearman"s rho= %g, P_Value= %g\n',r,p), plot(zx,zy,'ro-') الگو:پایان چپ‌چین مقدار ضریب اسپیرمن و مقدار احتمال محاسبه می‌شوند. توجه شود که مقدار احتمال تابعی از ضریب اسپیرمن و شمار نمونه هاست.

  • ضریب اسپیرمن: مقدار تابعیت یکنوای صعودی یا نزولی دو بردار
  • مقدار احتمال: احتمال عدم وجود یک تابع یکنوا بین دو بردار


همچنین می توان مقدار ضریب اسپیرمن را در اکسل با استفاده از تابع CORREL(array1, array2) محاسبه نمود.

منابع

الگو:آمار