تنظیم تیخونوف

از testwiki
نسخهٔ تاریخ ۱۶ ژانویهٔ ۲۰۲۲، ساعت ۱۹:۳۹ توسط imported>Sayenevisande (ابرابزار)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

تنظیم تیخونوف، که به نام آندره تیخونوف نامگذاری شده‌است، روشی برای منظم‌سازی در مسئله کمترین مربعات است.[۱] این روش معمولاً در مدلهایی که تعداد زیادی پارامتر دارند خوب عمل می‌کند. به‌طور کلی، این روش در ازای مقدار قابل اغماضی از اریبی، باعث بهبود بازدهی برآورد پارامتر می‌شود.[۲]

تعریف ریاضی

کمترین مربعات

در مسئله کمترین مربعات هدف یافتن بردار β است به قسمی که L(D,β)=||XβY||2 به کمترین مقدار ممکن برسد. در اینجا X یک ماتریس k×k ، β و Y بردارهای k×1 هستند و D={X,Y}. برای پیداکردن بهینه تابع، گرادیان L(D,β) را حساب کرده با صفر برابر می‌کنیم. نخست L(D,β) را بسط می‌دهیم: الگو:وسط‌چین L(D,β)=||XβY||2=(XβY)(XβY)=YYYXββXY+βXXβ الگو:پایان وسط‌چین

حال گرادیان این تابع را نسبت به β پیدا می‌کنیم که می‌شود: الگو:وسط‌چین L(D,β)β=(YYYXββXY+βXXβ)β=2XY+2XXβ الگو:پایان وسط‌چین با برابر قرار دادن گرادیان با صفر پارامتر بهینه بدست می‌آید: الگو:وسط‌چین 2XY+2XXβ=0XY=XXββ^=(XX)1XY الگو:پایان وسط‌چین

تنظیم تیخونوف

یکی از مشکلات اساسی که در این روش کمترین مربعات وجود دارد مشکل عدم وجود ماتریس وارون برای (𝐗𝖳𝐗) است. برای حل این مشکل تنظیم تیخونوف تابع L(D,β) را به تابع پایین تغییر می‌دهد:[۲][۳] الگو:وسط‌چین L(D,β)=||XβY||2+||Γβ||2=(XβY)(XβY)+βΓΓβ=YYYXββXY+βXXβ الگو:پایان وسط‌چین حال گرادیان این تابع را نسبت به β پیدا می‌کنیم که می‌شود: الگو:وسط‌چین L(D,β)β=(YYYXββXY+βXXβ+βXXβ)β=2XY+ 2XXβ+2βΓΓ الگو:پایان وسط‌چین با برابر قرار دادن گرادیان با صفر پارامتر بهینه بدست می‌آید: الگو:وسط‌چین 2XY+2XXβ+2βΓΓ=0XY=(XX+ΓΓ)ββ^=(XX+ΓΓ)1XY الگو:پایان وسط‌چین پس پارامتر بهینه ما برابر است با: الگو:وسط‌چین β^=(𝐗𝐗+ΓΓ)𝟏𝐗𝐘 الگو:پایان وسط‌چین

رگرسیون ستیغی

اگر Γ را با αI (در اینجا I ماتریس همانی است) برابر قرار دهیم، به جواب پایین می‌رسیم که همان رگرسیون ستیغی است. در این رگرسیون سعی بر این است که مقادیر پارامتر زیاد بزرگ نشود تا بیش‌برازش اتفاق نیفتد. با استفاده از ضریب لاگرانژ می‌توان نشان داد که این روش معادل بهینه‌سازی minβ||XβY||2 تحت محدودیتِ βi2c به ازای یک عدد c است.[۴]الگو:سخ الگو:وسط‌چین β^=(𝐗𝐗+α𝟐𝐈)𝟏𝐗𝐘 الگو:پایان وسط‌چین

جستارهای وابسته

منابع

الگو:پانویس