تابع پیش‌بینی‌کننده خطی

از testwiki
پرش به ناوبری پرش به جستجو

در آمار و یادگیری ماشینی، تابع پیش‌بینی‌کننده خطی یک تابع از ترکیب خطی متغیرهای مستقل (حاصل‌جمعِ ضرب یک سری از ضرایب با متغیرهای مستقل) است که برای پیش‌بینی یک متغیر وابسته استفاده می‌شود.[۱] ساده‌ترین نوع این توابع رگرسیون خطی، که در آن ضرایب، ضرایب رگرسیون نامیده می شوند. با این حال، آنها همچنین در انواع مختلف مدلهای دسته‌بندی مانند رگرسیون لجستیک،[۲] پرسپرون،[۳] ماشین‌های بردار پشتیبانی،[۴] و تجزیه و تحلیل تمایز خطی،[۵] و همچنین در مدل‌های مختلف دیگر مانند تجزیه و تحلیل مؤلفه اصلی[۶] و تحلیل عاملی. در بسیاری از این مدلها به ضرایب «وزن» گفته می‌شود.

تعریف ریاضی

اگر مجموع متغیرهای مستقل را x بنامیم و متغیر وابسته را با y نمایش دهیم پیش‌بینی y بر اساس x در توابع پیش‌بینی‌کننده خطی به شکل پایین صورت می‌پذیرد. به عبارت ساده‌تر برای پیش‌بینی متغیر وابسته فقط به ترکیب خطی متغیرهای مستقل نیاز است. در این فرمول فرض بر این است که تعداد ابعاد x، p است: الگو:وسط‌چین f(x)=g(β0+β1x1++βpxp) الگو:پایان وسط‌چین در رگرسیون خطی، تابع g() تابع همانی است به این معنی که:[۷][۲] الگو:وسط‌چین f(x)=β0+β1x1++βpxp الگو:پایان وسط‌چین در رگرسیون لجیستیک[۲] تابع f()به این شکل تعریف می‌شود، در این فرمول تابع سیگموید احتمال اینکه متغیر وابسته ۱ باشد را از طریق ترکیبی خطی از متغیرهای مستقل تعیین می‌کند:[۸] الگو:وسط‌چین f(x)={1,if  σ(β0+β1x1++βpxp)>0.50,otherwise الگو:پایان وسط‌چین در ماشین‌های بردار پشتیبانی g() تابع علامت است به این معنی که مقدار متغیر وابسته بسته به اینکه در کدام طرف اَبَرصفحه حاصل از ترکیب خطی متغیرهای مستقل قرار می‌گیرد تعیین می‌شود، در اینجا فرض بر این است که متغیرهای وابسته مقدار مثبت یا منفی یک می‌گیرند:[۴] الگو:وسط‌چین f(x)=sign(β0+β1x1++βpxp) الگو:پایان وسط‌چین

تابع تعمیم یافته

برای پیش‌بینی بهتر متغیر وابسته گاهی ترکیب خطی از نگاشتی از متغیرهای مستقل را در نظر می‌گیرند نه خود آنها را به این معنی که: الگو:وسط‌چین f(x)=g(β0+β1ϕ(x)1++βhϕ(x)h) الگو:پایان وسط‌چین در این تابع x از فضای p بُعدی به یک فضای h بُعدی از طریق نگاشت ϕ منتقل شده‌است و سپس در آن فضا مقادیر جدید از طریق ترکیب خطی با هم ترکیب شده‌اند.

به عنوان مثال در رگرسیون خطی تک متغیره می‌توان چندین متغیر وابسته را از طریق یک چند جمله‌ای درجه h حساب کرد، که این کار معادل نگاشت متغیر مستقل به یک فضای h بعدی و انجام رگرسیون در آن فضاست: الگو:وسط‌چین f(x)=β0+β1x+β2x2++βhxh الگو:پایان وسط‌چین

منابع

الگو:پانویس

  1. الگو:Cite journal
  2. ۲٫۰ ۲٫۱ ۲٫۲ الگو:Cite book
  3. Rosenblatt, Frank (1957), The Perceptron--a perceiving and recognizing automaton. Report 85-460-1, Cornell Aeronautical Laboratory.
  4. ۴٫۰ ۴٫۱ الگو:Cite journal
  5. الگو:Cite book
  6. Jolliffe I.T. Principal Component Analysis, Series: Springer Series in Statistics, 2nd ed. , Springer, NY, 2002, XXIX, 487 p. 28 illus. الگو:شابک۲
  7. الگو:Citation.
  8. الگو:Cite journal