هسته چندجملهای
در یادگیری ماشینی، هسته چندجملهای یک تابع هسته است که معمولاً با ماشینهای بردار پشتیبان (SVM) و سایر مدلهای مبتنی بر هسته استفاده میشود.
این هسته شباهت بردارها (ورودیهای آموزش) را در فضای ویژگی جدید که یک چندجملهای ساختهشده از ورودی هاست نشان میدهد. با این کار ما امکان یادگیری مدلهای غیرخطی را بهدست میآوریم.
بهطور شهودی، هسته چندجملهای تنها از ویژگیهای داده شده در نمونههای ورودی برای تعیین شباهت آنها استفاده نمیکند، بلکه ترکیبی از آنها را نیز در نظر میگیرد.[۱]
تعریف
برای چندجملهایهای درجه الگو:Mvar، هستهٔ چندجملهای به صورت زیر تعریف میشود.[۲] الگو:وسطچین الگو:پایان وسطچین که در آن الگو:Mvar و الگو:Mvar بردارهایی در فضای ورودی هستند، یعنی نمونههایی که در دادگان آموزش یا تست وجود دارند.
الگو:ریاضی یک پارامتر آزاد است که تأثیر عبارات درجه بالاتر یا پایینتر را مشخص میکند. وقتی الگو:ریاضی باشد، هسته همگن نامیده میشود.[۳] (یک هستهٔ تعمیمیافتهتر این است که الگو:ریاضی را بر یک پارامتر اسکالر مانند الگو:Mvar که توسط کاربر مشخص میشود تقسیم کنیم.[۴])
به عنوان یک هسته، الگو:Mvar نتیجهٔ یک ضرب داخلی در یک فضای ویژگی جدید است. برای رفتن به فضای جدید از نگاشت الگو:Mvar استفاده میشود: الگو:وسطچین الگو:پایان وسطچین کارکرد الگو:Mvar را میتوان در یک مثال بررسی کرد. الگو:ریاضی را در نظر بگیرید، بنابراین ما یک حالت خاص از هسته یعنی هستهٔ درجه دوم را داریم. الگو:وسطچین الگو:پایان وسطچین بنابراین نگاشت الگو:Mvar به صورت زیر خواهد بود. الگو:وسطچین الگو:پایان وسطچین حالت کلی ، زمانی که ، است برابر خواهد بود با: الگو:وسطچین الگو:پایان وسطچین الگو:وسطچین الگو:پایان وسطچین که آخرین عبارت به صورت است. و همچنین: الگو:وسطچین الگو:پایان وسطچین
کاربرد
اگرچه هسته تابع پایه شعاعی (RBF) در طبقهبندی به کمک ماشین بردار پشتیبانی از هسته چندجملهای محبوبتر است، ولی هستهٔ چندجملهای در پردازش زبان طبیعی بسیار محبوبتر است.[۱][۵]
رایجترین درجه الگو:ریاضی است، زیرا در مسائل پردازش زبان طبیعی درجات بزرگتر تمایل به بیشبرازش دارند.
مشکل
یکی از مشکلات هسته چندجملهای این است که ممکن است پایداری عددی[۶] نداشته باشید به این معنا که وقتی الگو:ریاضی باشد آنگاه الگو:ریاضی با افزایش الگو:Mvar به صفر میل میکند در حالی که وقتی که داشته باشیم الگو:ریاضی آنگاه الگو:ریاضی به بینهایت تمایل دارد.[۴]
منابع
- ↑ ۱٫۰ ۱٫۱ Yoav Goldberg and Michael Elhadad (2008). splitSVM: Fast, Space-Efficient, non-Heuristic, Polynomial Kernel Computation for NLP Applications. Proc. ACL-08: HLT.
- ↑ الگو:Cite web
- ↑ الگو:Cite arXiv
- ↑ ۴٫۰ ۴٫۱ الگو:Cite conference
- ↑ الگو:Cite journal
- ↑ الگو:Cite journal