الگوریتم کاهش ابعاد t-sne

از testwiki
نسخهٔ تاریخ ۱۴ مارس ۲۰۲۵، ساعت ۱۳:۰۳ توسط imported>FatemehJudy (growthexperiments-addlink-summary-summary:2|0|0)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

t-sne یک روش یادگیری خودران (خودسازمانده) غیر خطی است که برای اکتشاف و بصری‌سازی داده‌ها مورد استفاده قرار می‌گیرد. به بیان ساده‌تر، t-SNE به کاربر درکی از اینکه داده‌ها چگونه در فضای ابعاد بالا سازمان‌دهی شده‌اند ارائه می‌کند که این کار را با دادن موقعیت مکانی به هر نقطه داده در یک نقشه دو یا سه بعدی است به بیانی دیگر، هر شی با ابعاد بالا را با یک نقطه دو یا سه بعدی مدل می کند، به گونه‌ای که اجسام مشابه توسط نقاط نزدیک و اجسام غیر مشابه با نقاط دور با احتمال زیاد مدل می شوند.

تفاوت روش کاهش ابعاد t-SNE و PCA [۱]

حفظ فاصله کوچک با t-SNE (خط توپر) در مقایسه با PCA بیشینه‌سازی واریانس

تحلیل مؤلفه‌های اصلی یک روش کاهش ابعاد خطی است که در تلاش برای بیشینه کردن واریانس و حفظ فاصله‌های زیاد دوتایی‌ها از یکدیگر است. به عبارت دیگر، چیزهایی که با یکدیگر متفاوت هستند به صورت دور از هم به پایان می‌رسند. این امر می‌تواند منجر به این شود که در هنگام کار با ساختارهای غیرخطی خمینه شود. ساختار خمینه می‌تواند به صورت یک شکل جغرافیایی مثلا استوانه، کره، منحنی و دیگر موارد باشد.

نظر به اینکه تحلیل مؤلفه‌های اصلی به حفظ فاصله‌های دوتایی‌های بزرگ برای بیشینه کردن واریانس می‌پردازد، t-SNE با حفظ فاصله‌های کوچک دوتایی‌ها یا شباهت محلی از تحلیل مؤلفه‌های اصلی متمایز می‌شود.

نحوه کار الگوریتم t-SNE

الگوریتم t-sne شامل دو مرحله به شرح زیر است: مرحله اول بدین صورت است که، یک توزیع احتمال بر روی نقاط در ابعاد بالاتر ایجاد می‌کند به طوری که به اشیاء مشابه احتمال بالاتر و اشیا غیر مشابه احتمال کمتر اختصاص داده می شود.

مرحله دوم بدین صورت است که، همان توزیع احتمال را در ابعاد پایین‌تر به طور مکرر تکرار می‌کند تا زمانی که واگرایی کولبک-لیبلر به حداقل برسد. به بیانی دیگر، واگرایی کولبک-لیبلر معیاری برای اندازه‌گیری تفاوت بین توزیع‌های احتمال مرحله اول و دوم است.

پیاده‌سازی الگوریتم t-sne [۲]

یک مجموعه n عضوی اشیا با ابعاد بالا به صورت 𝐱1,,𝐱N در نظر بگیریم ابتدا احتمال pij که بیانگر اشیا 𝐱i و 𝐱j است به صورت زیر محاسبه می‌کنیم:

برای ij داریم

pji=exp(𝐱i𝐱j2/2σi2)kiexp(𝐱i𝐱k2/2σi2)

این احتمالات متقارن هستند. با این احتمالات متقارن، توزیع P را تشکیل می دهیم:

P=(pij)i,j=1n,pij=pji+pij2N

همانطور که در بخش قبل گفته شد هدف t-SNE این است که نقاط با ابعاد d به صورت 𝐲1,,𝐲N که تبدیل یافته از ابعاد بالا به پایین است را یاد بگیرد. مانند قبل برای توزیع Q داریم:

Q=(qij)i,j=1n,qij=(1+|yiyj|2)1kj(1+|ykyl|2)1

در اینجا، "رابطه-همسایگی" را با توزیع تی-استودنت مدل می‌کنیم. این جایی است که t در t-SNE از آنجا می‌آید.

حال هدف ما یافتن yi هایی از طریق بهینه سازی است به طوری که P و Q تا حد امکان به هم نزدیک باشند، بنابراین از واگرایی کولبک-لیبلر استفاده می‌کنیم و درایم:

KL(P|Q)=ijpijlogpijqij

حال با از واگرایی کولبک-لیبلر نسبت به yi گرادیان می‌گیریم تا به بهینه ترین جواب برسیم، بنابراین داریم:

KL(P|Q)yi=4j=1n(pijqij)(yiyj)(1+|yiyj|2)1

شبه کد [۳]

الگو:چپ‌چین

algorithm t-SNE is
    input: Data: X = [x1, ..., xN], xi in Rn, 
           Objective params: p (perplexity), 
           Optimization params: T(num of iterations), η (learning rate), α(momentum)
    output: Y = [y1, ..., yN], yi in Rm, m << n
    {pij} =pairwiseAffinites 0, p, X
    initialize Y = [y1, ..., yN] from N(0, 10−4 I)
    for i = 1 to T do
        compute low dimensional affinities qij
        compute ∂C / ∂yi
        yit = yit-1 + η (∂C / ∂yi)+ α(t)(yit-1 - yit-2)

الگو:پایان چپ‌چین

کاربردهای t-SNE

کاربردهای t-SNE در زمینه‌هایی به شرح زیر است:

  • پژوهش‌های اقلیمی
  • امنیت رایانه‌ای [۴]
  • بیوانفورماتیک [۵]
  • پژوهش‌های سرطان
  • یادگیری یا ارزیابی خوشه‌بندی، این کاربرد بدین گونه است که اغلب اوقات تعداد خوشه‌ها مقدم بر مدل‌سازی انتخاب یا پس از نتایج تکرار می‌شوند. t-SNE اغلب اوقات می‌تواند جداسازی شفافی در داده‌ها ارائه دهد. از این امر می‌توان مقدم بر استفاده از مدل خوشه‌بندی به منظور انتخاب تعداد خوشه‌ها یا بعدا برای ارزیابی اینکه خوشه ها به درستی داده‌ها را نگه می‌دارند یا خیر بهره برد. t-SNE یک رویکرد خوشه‌بندی نیست زیرا ورودی‌ها را مانند تحلیل مؤلفه‌های اصلی حفظ نمی‌کند و ممکن است مقادیر بین اجراها تغییر کنند، بنابراین از این روش صرفا برای اکتشاف استفاده می‌شود.

منابع

الگو:پانویس

  1. Pareek, Jyoti & Jacob, Joel. (2020). Data Compression and Visualization Using PCA and T-SNE. 10.1007/978-981-15-5421-6_34.
  2. Maaten, L.V., & Hinton, G.E. (2008). Visualizing Data using t-SNE. Journal of Machine Learning Research, 9, 2579-2605.
  3. Saha, D. K., Calhoun, V. D., Yuhui, D. U., Zening, F. U., Panta, S. R., & Plis, S. M. (2019). DSNE: A visualization approach for use with decentralized data. Unknown Journal. https://doi.org/10.1101/826974
  4. Hamid, Yasir & Muthukumarasamy, Sugumaran. (2019). A t-SNE based non linear dimension reduction for network intrusion detection. International Journal of Information Technology. 12. 10.1007/s41870-019-00323-9.
  5. 65. Li, W.; Cerise, J.E.; Yang, Y.; Han, H. Application of T-SNE to Human Genetic Data. J. Bioinform. Comput. Biol. 2017, 15, 1750017.