رگرسیون چندک

از testwiki
نسخهٔ تاریخ ۱۴ سپتامبر ۲۰۲۴، ساعت ۱۳:۳۷ توسط imported>AKhaleghizadeh (ابرابزار و بیشتر)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

الگو:تحلیل رگرسیون

رگرسیون چندکالگو:یادچپ یکی از روش‌های تحلیل رگرسیون است که در آن برخلاف رگرسیون خطی که هدف تخمین میانگین متغیر وابسته است یک یا چند چندکِ متغیر وابسته محاسبه می‌شود است.[۱] رگرسیون چندک معمولاً با داده‌های پرت بهتر از رگرسیون معمولی کار می‌کند و پیش‌فرضهای کمتری دارد، من‌جمله اینکه توزیع شرطی متغیر وابسته ضرورتاً لازم نیست توزیعی طبیعی باشد. همچنین رگرسیون چندک در مسائلی به کار می‌رود که هدف به دست آوردن توزیع مشروط متغیر وابسته باشد نه فقط یک آماره از آن مانند میانگین؛ چه که با استفاده از چندک‌های یک توزیع می‌توان کل توزیع را تقریب زد.[۲]

رابطه ریاضی

اگر FY(y)=P(Yy) تابع توزیع تجمعیِ متغیر Y باشد، و τ عددی در (0,1) باشد، آنگاه چندک مرتبط با این عدد به این شکل تعریف می‌شود:[۱]الگو:وسط‌چین QY(τ)=FY1(τ)=inf{y:FY(y)τ} الگو:پایان وسط‌چینمی‌توان نشان‌داد که:الگو:وسط‌چین QY(τ)=minuE(ρτ(Yu))=minu{(τ1)u(yu)dFY(y)+τu(yu)dFY(y)} الگو:پایان وسط‌چینکه در اینجا ρτ(y)=y(τ𝕀(y<0))است. حال اگر تابع توزیع تجمعی را نداشته باشیم و فقط n نمونه از توزیع متغیر داشته باشیم آنگاه چندک متغیر را با بهینه‌سازی پایین می‌توان به‌دست‌آورد.[۱]الگو:وسط‌چین Q^Y(τ)=arg minui=1nρτ(yiu)=arg minu[(τ1)yi<u(yiu)+τyiu(yiu)] الگو:پایان وسط‌چینحال اگر چندکِ متغیر وابسته را با ترکیبی خطی از متغیرهای مستقل تخمین بزنیم آنگاه هدف مسئله رگرسیون خطی پیدا کردن ضرایبی خواهد بود که داده‌های وابسته را به چندکشان نزدیک کند:الگو:وسط‌چین β^τ=arg minβi=1nρτ(yiβ.xi) الگو:پایان وسط‌چیناین مسئله بهینه‌سازی با کمک برنامه‌ریزی خطی حل می‌شود. اگر τ با 0.5 برابر باشد، رگرسیون خطی، میانه را تخمین خواهد زد و تابع هزینه به مجموع قدر مطلق تفاضل پیش‌بینی و داده وابسته تغییر شکل می‌یابد:الگو:وسط‌چین β^0.5=arg minβi=1nρ0.5(yiβ.xi)=arg minβi=1n|yiβ.xi| الگو:پایان وسط‌چین

کاربرد

رگرسیون چندک در علوم بوم‌شناسی کاربرد فراوانی دارد.[۳] معمولاً به علت پیچیدگی و تعداد زیاد عوامل تأثیرگذار در یک رویداد طبیعی، توزیع‌های شرطی متغیرهای وابسته اغلب واریانس بالا و غیرهمسانی دارند که باعث می‌شود رابطه بین متغیرهای مستقل و میانگین توزیع شرطی ضعیف شود؛ تقریب کل توزیع شرطی با استفاده از برآورد خطی چندک‌های توزیع شرطی دارای اطلاعات بیشتری برای پژوهشگران این رشته است و این تقریب از طریق رگرسیون چندک به دست می‌آید.[۳]

جستارهای وابسته

یادداشت‌ها


الگو:چندستونه الگو:یادداشت الگو:پایان چندستونه

منابع

الگو:پانویس