هسته چندجمله‌ای

از testwiki
نسخهٔ تاریخ ۲۰ نوامبر ۲۰۲۳، ساعت ۱۶:۲۰ توسط imported>Massol1360 (انتقال از رده:روش‌های هسته برای یادگیری ماشینی به رده:روش‌های هسته برای یادگیری ماشین رده‌انبوه)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

در یادگیری ماشینی، هسته چندجمله‌ای یک تابع هسته است که معمولاً با ماشین‌های بردار پشتیبان (SVM) و سایر مدل‌های مبتنی بر هسته استفاده می‌شود.

نگاشت φ. در سمت چپ مجموعه‌ای از نمونه‌ها در فضای ورودی، در سمت راست همان نمونه‌ها در فضای ویژگی که هسته چندجمله‌ای K(x,y) (برای برخی از مقادیر پارامترها c و d) محصول درونی است. ابرصفحه‌ای که در فضای ویژگی توسط یک ماشین بردار پشتیبان یادگرفته می‌شود، یک بیضی در فضای ورودی است.

این هسته شباهت بردارها (ورودی‌های آموزش) را در فضای ویژگی جدید که یک چندجمله‌ای ساخته‌شده از ورودی هاست نشان می‌دهد. با این کار ما امکان یادگیری مدل‌های غیرخطی را به‌دست می‌آوریم.

به‌طور شهودی، هسته چندجمله‌ای تنها از ویژگی‌های داده شده در نمونه‌های ورودی برای تعیین شباهت آنها استفاده نمی‌کند، بلکه ترکیبی از آنها را نیز در نظر می‌گیرد.[۱]

تعریف

برای چندجمله‌ای‌های درجه الگو:Mvar، هستهٔ چندجمله‌ای به صورت زیر تعریف می‌شود.[۲] الگو:وسط‌چین K(x,y)=(x𝖳y+c)d الگو:پایان وسط‌چین که در آن الگو:Mvar و الگو:Mvar بردارهایی در فضای ورودی هستند، یعنی نمونه‌هایی که در دادگان آموزش یا تست وجود دارند.

الگو:ریاضی یک پارامتر آزاد است که تأثیر عبارات درجه بالاتر یا پایین‌تر را مشخص می‌کند. وقتی الگو:ریاضی باشد، هسته همگن نامیده می‌شود.[۳] (یک هستهٔ تعمیم‌یافته‌تر این است که الگو:ریاضی را بر یک پارامتر اسکالر مانند الگو:Mvar که توسط کاربر مشخص می‌شود تقسیم کنیم.[۴])

به عنوان یک هسته، الگو:Mvar نتیجهٔ یک ضرب داخلی در یک فضای ویژگی جدید است. برای رفتن به فضای جدید از نگاشت الگو:Mvar استفاده می‌شود: الگو:وسط‌چین K(x,y)=φ(x),φ(y) الگو:پایان وسط‌چین کارکرد الگو:Mvar را می‌توان در یک مثال بررسی کرد. الگو:ریاضی را در نظر بگیرید، بنابراین ما یک حالت خاص از هسته یعنی هستهٔ درجه دوم را داریم. الگو:وسط‌چین K(x,y)=(i=1nxiyi+c)2=i=1n(xi2)(yi2)+i=2nj=1i1(2xixj)(2yiyj)+i=1n(2cxi)(2cyi)+c2 الگو:پایان وسط‌چین بنابراین نگاشت الگو:Mvar به صورت زیر خواهد بود. الگو:وسط‌چین φ(x)=xn2,,x12,2xnxn1,,2xnx1,2xn1xn2,,2xn1x1,,2x2x1,2cxn,,2cx1,c الگو:پایان وسط‌چین حالت کلی (𝐱T𝐲+c)d ، زمانی که 𝐱n ، 𝐲n است برابر خواهد بود با: الگو:وسط‌چین (𝐱T𝐲+c)d=j1+j2++jn+1=dd!j1!jn!jn+1!x1j1xnjncjn+1d!j1!jn!jn+1!y1j1ynjncjn+1=φ(𝐱)Tφ(𝐲) الگو:پایان وسط‌چین الگو:وسط‌چین φ(𝐱)=(a1,,al,,ald) الگو:پایان وسط‌چین که آخرین عبارت به صورت ld=(n+dd) است. و همچنین: الگو:وسط‌چین al=d!j1!jn!jn+1!x1j1xnjncjn+1|j1+j2++jn+jn+1=d الگو:پایان وسط‌چین

کاربرد

اگرچه هسته تابع پایه شعاعی (RBF) در طبقه‌بندی به کمک ماشین بردار پشتیبانی از هسته چندجمله‌ای محبوب‌تر است، ولی هستهٔ چندجمله‌ای در پردازش زبان طبیعی بسیار محبوب‌تر است.[۱][۵]

رایج‌ترین درجه الگو:ریاضی است، زیرا در مسائل پردازش زبان طبیعی درجات بزرگ‌تر تمایل به بیش‌برازش دارند.

مشکل

یکی از مشکلات هسته چندجمله‌ای این است که ممکن است پایداری عددی[۶] نداشته باشید به این معنا که وقتی الگو:ریاضی باشد آنگاه الگو:ریاضی با افزایش الگو:Mvar به صفر میل می‌کند در حالی که وقتی که داشته باشیم الگو:ریاضی آنگاه الگو:ریاضی به بی‌نهایت تمایل دارد.[۴]

منابع

الگو:پانویس

  1. ۱٫۰ ۱٫۱ Yoav Goldberg and Michael Elhadad (2008). splitSVM: Fast, Space-Efficient, non-Heuristic, Polynomial Kernel Computation for NLP Applications. Proc. ACL-08: HLT.
  2. الگو:Cite web
  3. الگو:Cite arXiv
  4. ۴٫۰ ۴٫۱ الگو:Cite conference
  5. الگو:Cite journal
  6. الگو:Cite journal