رگرسیون چندک
رگرسیون چندکالگو:یادچپ یکی از روشهای تحلیل رگرسیون است که در آن برخلاف رگرسیون خطی که هدف تخمین میانگین متغیر وابسته است یک یا چند چندکِ متغیر وابسته محاسبه میشود است.[۱] رگرسیون چندک معمولاً با دادههای پرت بهتر از رگرسیون معمولی کار میکند و پیشفرضهای کمتری دارد، منجمله اینکه توزیع شرطی متغیر وابسته ضرورتاً لازم نیست توزیعی طبیعی باشد. همچنین رگرسیون چندک در مسائلی به کار میرود که هدف به دست آوردن توزیع مشروط متغیر وابسته باشد نه فقط یک آماره از آن مانند میانگین؛ چه که با استفاده از چندکهای یک توزیع میتوان کل توزیع را تقریب زد.[۲]
رابطه ریاضی
اگر تابع توزیع تجمعیِ متغیر باشد، و عددی در باشد، آنگاه چندک مرتبط با این عدد به این شکل تعریف میشود:[۱]الگو:وسطچین الگو:پایان وسطچینمیتوان نشانداد که:الگو:وسطچین الگو:پایان وسطچینکه در اینجا است. حال اگر تابع توزیع تجمعی را نداشته باشیم و فقط نمونه از توزیع متغیر داشته باشیم آنگاه چندک متغیر را با بهینهسازی پایین میتوان بهدستآورد.[۱]الگو:وسطچین الگو:پایان وسطچینحال اگر چندکِ متغیر وابسته را با ترکیبی خطی از متغیرهای مستقل تخمین بزنیم آنگاه هدف مسئله رگرسیون خطی پیدا کردن ضرایبی خواهد بود که دادههای وابسته را به چندکشان نزدیک کند:الگو:وسطچین الگو:پایان وسطچیناین مسئله بهینهسازی با کمک برنامهریزی خطی حل میشود. اگر با برابر باشد، رگرسیون خطی، میانه را تخمین خواهد زد و تابع هزینه به مجموع قدر مطلق تفاضل پیشبینی و داده وابسته تغییر شکل مییابد:الگو:وسطچین الگو:پایان وسطچین
کاربرد
رگرسیون چندک در علوم بومشناسی کاربرد فراوانی دارد.[۳] معمولاً به علت پیچیدگی و تعداد زیاد عوامل تأثیرگذار در یک رویداد طبیعی، توزیعهای شرطی متغیرهای وابسته اغلب واریانس بالا و غیرهمسانی دارند که باعث میشود رابطه بین متغیرهای مستقل و میانگین توزیع شرطی ضعیف شود؛ تقریب کل توزیع شرطی با استفاده از برآورد خطی چندکهای توزیع شرطی دارای اطلاعات بیشتری برای پژوهشگران این رشته است و این تقریب از طریق رگرسیون چندک به دست میآید.[۳]
جستارهای وابسته
یادداشتها
الگو:چندستونه
الگو:یادداشت
الگو:پایان چندستونه