پیش‌نویس:منحنی یادگیری (یادگیری ماشینی)

از testwiki
پرش به ناوبری پرش به جستجو
نمودار منحنی یادگیری اندازه مجموعه آموزشی در مقابل امتیاز تمرین (کاهش) و امتیاز اعتبار سنجی متقابل

الگو:یادگیری ماشین در یادگیری ماشین، منحنی یادگیری (یا منحنی آموزشی ) یک نمایش ترسیمی است که نشان می‌ دهد چگونه عملکرد یک مدل در یک مجموعه آموزشی (و معمولاً یک مجموعه اعتبار سنجی) با تعداد تکرار های آموزشی ( دوران ) یا مقدار داده های آموزشی تغییر می‌ کند. [۱] به طور معمول، تعداد دور های آموزشی یا اندازه مجموعه آموزشی روی محور x و مقدار تابع ضرر (و احتمالاً برخی معیارهای دیگر مانند امتیاز اعتبار سنجی متقابل ) روی محور y ترسیم می‌ شوند.

هم معنی ها عبارتند از منحنی خطا ، منحنی تجربه ، منحنی بهبود و منحنی کلی گری . [۲]

به شکل انتزاعی تر، منحنی های یادگیری تفاوت بین تلاش یادگیری و عملکرد پیش بینی شده را نشان می دهند، به طوری که "تلاش یادگیری" معمولاً به نشان دهنده تعداد نمونه های آموزشی است و "عملکرد پیش بینی شده" به معنای دقت در نمونه های آزمایشی است. [۳]

منحنی های یادگیری کارایی های مفید بسیاری در یادگیری ماشین دارند، از جمله: [۴] [۵] [۶]

  • انتخاب پارامترهای مدل در طول طراحی،
  • تنظیم بهینه سازی برای بهبود هم گرایی،
  • و تشخیص مشکلاتی مانند برازش بیش از حد (یا عدم تناسب).

منحنی‌ های یادگیری همچنین می‌ توانند ابزاری برای تعیین میزان سود یک مدل از افزایش داده‌ های آموزشی بیشتر باشند و یا نشان دهند آیا مدل از خطای واریانس یا خطای سو گیری بیشتر متضرر می‌ شوند. اگر هم امتیاز اعتبار سنجی و هم امتیاز آموزشی به مقدار معینی همگرا شوند، آنگاه مدل دیگر به طور قابل توجهی از داده های آموزشی بیشتر بهره نخواهد برد. [۷]

تعریف رسمی

هنگام ایجاد یک تابع برای تقریب توزیع برخی از داده ها، لازم است یک تابع ضرر L(fθ(X),Y) برای اندازه گیری میزان سودمند بودن خروجی مدل تعریف شود. (به عنوان مثال، دقت برای کار های طبقه بندی یا میانگین مربع های خطا برای کاهش). سپس ما یک فرآیند بهینه‌ سازی را تعریف می‌ کنیم که پارامترهای مدل را مانند θ پیدا می‌ کند. به گونه ای که L(fθ(X),Y) به حداقل می رسد و با θ* نمایش داده میشود.

منحنی آموزش برای مقدار داده

اگر داده های آموزشی چنین باشد

{x1,x2,,xn},{y1,y2,yn}

و داده های اعتبار سنجی

{x1,x2,xm},{y1,y2,ym} ،

منحنی یادگیری نمودار دو منحنی است

  1. iL(fθ*(Xi,Yi)(Xi),Yi)
  2. iL(fθ*(Xi,Yi)(Xi),Yi)

بطوری که

Xi={x1,x2,xi}

منحنی تمرین برای تعداد تکرار

  1. iL(fθi*(X,Y)(X),Y)
  2. iL(fθi*(X,Y)(X),Y)

همچنین ببینید