یادگیری انتقال

از testwiki
نسخهٔ تاریخ ۱۲ مهٔ ۲۰۲۳، ساعت ۱۹:۴۹ توسط imported>InternetArchiveBot (نجات ۱ منبع و علامت‌زدن ۰ به‌عنوان مرده.) #IABot (v2.0.9.4)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

انتقال یادگیری (TL) یک موضوع تحقیقاتی در یادگیری ماشین (ML) است که بر روی ذخیره دانش به دست آمده در هنگام حل یک مسئله و استفاده از آن در یک مسئله متفاوت ولی مرتبط متمرکز است. [۱] به عنوان مثال ، دانش به دست آمده در هنگام یادگیری شناخت ماشین می تواند هنگام تلاش برای شناسایی کامیون ها به کار رود.از دیدگاه عملی، استفاده دوباره یا انتقال اطلاعات از وظایف قبلاً یاد گرفته شده برای یادگیری وظایف جدید این توانایی را دارد که به طور قابل توجهی کارایی نمونه یک عامل یادگیری تقویت کننده را بهبود بخشد. [۲]

تاریخ

در سال 1976 استوو بوزینوفسکی(Stevo Bozinovski) و آنته فولگوسی( Ante Fulgosi) مقاله ای را منتشر کردند که صریحاً به یادگیری انتقال در آموزش شبکه های عصبی می پردازد. [۱]

در سال 1997 ، لورین پرت(Lorien Pratt) و سباستین ترون ( Sebastian Thrun) یک نسخه ویژه از یادگیری ماشین را که به انتقال یادگیری اختصاص یافته بود ،تولید کردند [۳] و تا سال 1998 ، این رشته شامل یادگیری چند کاره بود ، [۴] همراه با تجزیه و تحلیل رسمی تر از مبانی نظری آن. پایه ها [۵] یادگیری برای یاد گرفتن(Learning to Learn) ، الگو:Sfn ویرایش شده توسط Thrun و Pratt ، مروری بر این موضوع در سال 1998 است.

Andrew Ng در آموزش NIPS 2016 خود [۶] [۷] [۸] گفت که TL پس از یادگیری نظارت شده برای برجسته کردن اهمیت TL ، عامل بعدی موفقیت تجاری ML خواهد بود.

تعریف

  • تعریف یادگیری انتقالی از نظر حوزه ها و وظایف ارائه شده است. یک دامنه 𝒟 شامل: یک فضای ویژگی 𝒳 و یک توزیع احتمال حاشیه ای P(X) ، به طوری کهX={x1,...,xn}𝒳 . با توجه به یک دامنه خاص ، 𝒟={𝒳,P(X)} ، یک کار از دو جز تشکیل شده است: فضای برچسب 𝒴 و یک عملکرد پیش بینی عینی f:𝒳𝒴 . تابع f برای پیش بینی برچسب مربوطه استفاده می شود f(x) از یک نمونه جدید x . این وظیفه ، مشخص شده توسط 𝒯={𝒴,f(x)} ، از داده های آموزشی متشکل از جفت آموخته می شود {xi,yi} ، به طوری که که xiX و yi𝒴 . [۹]

با توجه به دامنه منبع 𝒟S و کار یادگیری 𝒯S ، یک دامنه هدف 𝒟T و یادگیری کار 𝒯T ، به طوری که 𝒟S𝒟T ، یا 𝒯S𝒯T ، یادگیری انتقال با هدف کمک به بهبود یادگیری عملکرد پیش بینی تابع fT() که در 𝒟T با استفاده از دانش در 𝒟S و 𝒯S است . [۱۰]

برنامه های کاربردی

الگوریتم ها برای یادگیری انتقال در شبکه های منطقی مارکوف(Markov logic networks) [۱۱] و شبکه های بیزی (Bayesian networks)در دسترس هستند. [۱۲] یادگیری انتقال نیز در کشف زیر نوع سرطان ، [۱۳] استفاده از ساختمان ، [۱۴] [۱۵] بازی عمومی ، [۱۶] طبقه بندی متن ، [۱۷] [۱۸] تشخیص رقم ، [۱۹] تصویربرداری پزشکی و فیلتر کردن هرزنامه(spam) اعمال شده است. . [۲۰]

در سال 2020 کشف شد که، با توجه به طبیعت جسمی مشابه خود، یادگیری انتقال بین سیگنال های الکترومایوگرافی (EMG) از ماهیچه ها به هنگام طبقه بندی رفتار امواج مغزی (EEG) ممکن است. همچنین اشاره شد که این رابطه برعکس عمل می کند ، نشان می دهد که می توان از EEG برای طبقه بندی EMG علاوه بر این استفاده کرد. [۲۱] این آزمایش‌ها نشان داد که دقت شبکه های عصبی و شبکه های عصبی کانولوشن [۲۲] با یادگیری انتقال هم در دوره اول (قبل از هرگونه یادگیری ، یعنی در مقایسه با توزیع وزن تصادفی استاندارد) و هم در مجانب (انتهای فرایند یادگیری). یعنی الگوریتم ها با قرار گرفتن در دامنه دیگری بهبود می یابند. علاوه بر این ، کاربر نهایی یک مدل از پیش آموزش دیده می تواند ساختار لایه های کاملاً متصل را برای دستیابی به عملکرد برتر تغییر دهد. [۲۳]

همچنین ببینید

منابع

الگو:پانویس

  1. ۱٫۰ ۱٫۱ الگو:Cite web
  2. الگو:Cite journal
  3. الگو:Cite web
  4. Caruana, R., "Multitask Learning", pp. 95-134 in الگو:Harvard citation no brackets
  5. Baxter, J., "Theoretical Models of Learning to Learn", pp. 71-95 الگو:Harvard citation no brackets
  6. الگو:Citation
  7. الگو:Cite web
  8. Nuts and bolts of building AI applications using Deep Learning, slides
  9. الگو:Cite journal Material was copied from this source, which is available under a Creative Commons Attribution 4.0 International License.
  10. الگو:Cite journal Material was copied from this source, which is available under a Creative Commons Attribution 4.0 International License.
  11. الگو:Citation
  12. الگو:Citation
  13. Hajiramezanali, E. & Dadaneh, S. Z. & Karbalayghareh, A. & Zhou, Z. & Qian, X. Bayesian multi-domain learning for cancer subtype discovery from next-generation sequencing count data. 32nd Conference on Neural Information Processing Systems (NeurIPS 2018), Montréal, Canada. الگو:Arxiv
  14. الگو:Cite conference
  15. الگو:Cite journal
  16. Banerjee, Bikramjit, and Peter Stone. "General Game Learning Using Knowledge Transfer الگو:Webarchive." IJCAI. 2007.
  17. الگو:Cite conference
  18. الگو:Cite conference
  19. الگو:Cite journal
  20. الگو:Cite conference
  21. الگو:Cite journal
  22. الگو:Cite journal
  23. Kabir, H. M., Abdar, M., Jalali, S. M. J., Khosravi, A., Atiya, A. F., Nahavandi, S., & Srinivasan, D. (2020). Spinalnet: Deep neural network with gradual input. arXiv preprint arXiv:2007.03347.