همبستگی کانونی

از testwiki
نسخهٔ تاریخ ۲۰ نوامبر ۲۰۲۳، ساعت ۱۵:۴۹ توسط imported>Massol1360 (انتقال از رده:یادگیری ماشینی به رده:یادگیری ماشین رده‌انبوه)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

در آمار، آنالیز همبستگی کانونی (CCA)، که آنالیز متغیرهای کانونی نیز نامیده می‌شود، راهی برای دریافت اطلاعات از ماتریس‌های کوواریانس متقاطع(cross-covariance matrices) است. اگر دو بردار X = (X 1 , . . .، X n) و Y = (Y 1 , . . .، Y m) داشته باشیم که از متغیرهای تصادفی تشکیل شده‌اند، و بین متغیرها همبستگی وجود دارد، سپس تحلیل همبستگی کانونی، ترکیبات خطی X و Y را پیدا می‌کند که حداکثر همبستگی را با یکدیگر دارند.[۱] TR Knapp خاطرنشان می‌کند که «تقریباً تمام آزمون‌های پارامتری مهم که معمولاً با آنها مواجه می‌شوند را می‌توان به عنوان موارد ویژه ای از تجزیه و تحلیل همبستگی متعارف در نظر گرفت، که روش کلی برای بررسی روابط بین دو مجموعه از متغیرها است.»[۲] این روش برای اولین بار توسط هارولد هتلینگ در سال ۱۹۳۶ معرفی شد،[۳] اگرچه در زمینه زوایای بین تخت (angles between flats)، مفهوم ریاضی توسط جردن در سال ۱۸۷۵ منتشر شد.

تعریف

با توجه به دو بردار ستونی X=(x1,,xn)T و Y=(y1,,ym)T از متغیرهای تصادفی، می‌توان کوواریانس متقاطع را تعریف کرد ΣXY=cov(X,Y) که یک ماتریس n×m می‌دهد که (i,j) ورودی کوواریانس است cov(xi,yj) . در عمل، ماتریس کوواریانس را بر اساس داده‌های نمونه‌برداری شده X و Y تخمین می‌زنیم (یعنی از یک جفت ماتریس داده).

تحلیل همبستگی کانونی به دنبال بردارهای (an)a و (bm)b است به طوری که متغیرهای تصادفی aTX و bTY همبستگی ρ=corr(aTX,bTY) را به حداکثر برساند. متغیرهای تصادفی (اسکالر) U=aTX و V=bTY اولین جفت متغیرهای کانونی هستند. سپس به دنبال بردارهایی می‌گردیم که همان همبستگی را با این محدودیت که با اولین جفت متغیرهای کانونی همبستگی ندارند، به حداکثر برسانند. این کار جفت دوم متغیرهای کانونی را به ما می‌دهد. این روش ممکن است تا min{m,n} بار به طول انجامد.

محاسبات

مشتق

فرض کنید ΣXY ماتریس کوواریانس متقاطع برای هر جفت (بردار شکل) متغیر تصادفی X و Y باشد. تابع هدف برای به حداکثر رساندن رابطهٔ زیر می‌باشد: الگو:وسط‌چین ρ=aTΣXYbaTΣXXabTΣYYb. الگو:پایان وسط‌چین اولین قدم تعریف تغییر مبنا است بنابراین داریم: الگو:وسط‌چین c=ΣXX1/2a, الگو:پایان وسط‌چین الگو:وسط‌چین d=ΣYY1/2b. الگو:پایان وسط‌چین با جایگذاری دو رابطه بالا در رابطه اصلی داریم: الگو:وسط‌چین ρ=cTΣXX1/2ΣXYΣYY1/2dcTcdTd. الگو:پایان وسط‌چین حال با توجه به نابرابری کوشی-شوارتز داریم: الگو:وسط‌چین (cTΣXX1/2ΣXYΣYY1/2)(d)(cTΣXX1/2ΣXYΣYY1/2ΣYY1/2ΣYXΣXX1/2c)1/2(dTd)1/2, الگو:پایان وسط‌چین الگو:وسط‌چین ρ(cTΣXX1/2ΣXYΣYY1ΣYXΣXX1/2c)1/2(cTc)1/2. الگو:پایان وسط‌چین اگر بردارها d و ΣYY1/2ΣYXΣXX1/2c خطی باشند برابری وجود دارد. علاوه بر این، اگر c بردار ویژه با حداکثر مقدار ویژه برای ماتریس ΣXX1/2ΣXYΣYY1ΣYXΣXX1/2 باشد حداکثر همبستگی به دست می‌آید. جفت‌های بعدی با استفاده از مقادیر ویژه قدرهای کاهشی (decreasing magnitudes) پیدا می‌شوند. متعامد بودن با تقارن ماتریس‌های همبستگی تضمین می‌شود.

راه دیگری برای مشاهده این محاسبات این است که c و d بردارهای منفرد(singular vectors) چپ و راست ماتریس همبستگی X و Y باشند که مربوط به بالاترین مقدار منفرد(singular value) هستند.

حل

حل آن به شکل زیر می‌باشد:

  • c یک بردار ویژه ΣXX1/2ΣXYΣYY1ΣYXΣXX1/2 می‌باشد
  • d متناسب است با ΣXX1/2ΣXYΣYY1ΣYXΣXX1/2

متقابلاً داریم:

  • d یک بردار ویژه ΣXX1/2ΣXYΣYY1ΣYXΣXX1/2 می‌باشد
  • c متناسب است با ΣXX1/2ΣXYΣYY1ΣYXΣXX1/2

با معکوس کردن تغییر مختصات، داریم:

  • a یک بردار ویژه ΣXX1ΣXYΣYY1ΣYX می‌باشد
  • a متناسب است با ΣXX1ΣXYΣYY1ΣYX
  • b یک بردار ویژه ΣYY1ΣYXΣXX1ΣXY, می‌باشد
  • b متناسب است با ΣYY1ΣYXΣXX1ΣXY,

متغیرهای متعارف به صورت زیر تعریف می‌شوند: الگو:وسط‌چین U=cTΣXX1/2X=aTX الگو:پایان وسط‌چین الگو:وسط‌چین V=dTΣYY1/2Y=bTY الگو:پایان وسط‌چین

کاربردهای عملی

یک استفاده معمولی برای همبستگی متعارف در زمینه تجربی این است که دو مجموعه از متغیرها را در نظر بگیرید و ببینید چه چیزی در بین دو مجموعه مشترک است.[۴] به عنوان مثال، در تست روان‌شناختی، می‌توان دو تست شخصیت چند بعدی را انجام داد، مانند پرسشنامه شخصیت چند مرحله‌ای مینه‌سوتا (MMPI-2) و NEO. با مشاهده اینکه چگونه عوامل MMPI-2 با عوامل NEO ارتباط دارند، می‌توان بینشی در مورد ابعاد مشترک بین آزمون‌ها و میزان واریانس به دست آورد. برای مثال، ممکن است متوجه شویم که یک بعد برون گرایی یا روان رنجورخویی مقدار قابل توجهی از واریانس مشترک بین این دو آزمون را به خود اختصاص داده‌است.

همچنین می‌توان از تحلیل همبستگی کانونی برای تولید یک معادله مدل استفاده کرد که دو مجموعه از متغیرها را به هم مرتبط می‌کند، برای مثال مجموعه ای از معیارهای عملکرد و مجموعه ای از متغیرهای توضیحی، یا مجموعه ای از خروجی‌ها و مجموعه ای از ورودی‌ها. محدودیت‌های محدودیتی را می‌توان بر روی چنین مدلی اعمال کرد تا اطمینان حاصل شود که الزامات نظری یا شرایط شهودی بدیهی را منعکس می‌کند. این نوع مدل به عنوان مدل حداکثر همبستگی(maximum correlation) شناخته می‌شود.

مثال

فرض کنید X=x1 با امید ریاضی صفر، به عنوان مثال، E(X)=0 .

  1. اگر Y=X ، یعنی X و Y کاملاً همبسته هستند، پس، به عنوان مثال، a=1 و b=1 ، به طوری که اولین (و تنها در این مثال) جفت متغیر کانونی است U=X و V=Y=X .
  2. اگر Y=X ، یعنی X و Y کاملاً ضد همبسته(anticorrelated) هستند، پس، به عنوان مثال، a=1 و b=1 ، به طوری که اولین (و تنها در این مثال) جفت متغیر کانونی برابر U=X و V=Y=X است.

ما متوجه می‌شویم که در هر دو مورد U=V ، که نشان می‌دهد که تحلیل همبستگی کانونی با متغیرهای همبسته و ضدهمبسته به‌طور مشابه رفتار می‌کند.

منابع

الگو:پانویس