خطای میانگین مربعات

از testwiki
نسخهٔ تاریخ ۱۹ اکتبر ۲۰۲۳، ساعت ۱۰:۲۵ توسط imported>Dexbot (ربات: انتقال رده به درخواست AKhaleghizadeh از رده:تخمین کارایی نقطه‌ای به رده:برآورد کارایی نقطه‌ای)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

در ریاضیات و آمار، میانگین توان دوم خطاها (الگو:Lang-en یا به‌طور مخفف MSE) روشی برای برآورد میزان خطاست که در واقع تفاوت بین مقادیر تخمینی و آنچه تخمین زده شده، است. MSE به دو دلیل تقریباً همه جا مثبت است (صفر نیست) یک اینکه تصادفی است و دوم به این دلیل که تخمین‌گر اطلاعاتی که قابلیت تولید تخمین دقیق تری دارد را حساب نمی‌کند. پس این شاخص که مقداری همواره نامنفی دارد، هرچقدر مقدار آن به صفر نزدیکتر باشد، نشان دهنده میزان کمتر خطاست.

MSE شامل واریانس تخمین‌گر و بایاس (سوگیری) است. برای یک برآوردگر غیر بایاس، MSE همان واریانس برآوردگر است. مثل واریانس، MSE همان واحدهای اندازه‌گیری را به عنوان مربع مقادیر تخمین زده شده، دارد. در مقایسه با انحراف معیار ریشه دوم گرفتن از MSE، خطای ریشه میانگین مربع یا انحراف معیار میانگین ریشه (خطای جذر میانگین مربعات) را ارایه می‌دهد.

برای هر برآوردگر غیر بایاس،RSME ریشه دوم واریانس است که به عنوان خطای استاندارد شناخته می‌شود.

روش محاسبه

تعریف MSE بر اساس توصیف تخمین‌گر یا پیش‌بینی کننده متفاوت است.

برای بدست آوردن میانگین توان دوم خطاها از یک مجموعه یا n داده می‌توان از رابطه زیر استفاده کرد:

MSE=1ni=1n(YiYi^)2.

که در آن (1ni=1n) عمل میانگین‌گیری را انجام می‌دهد و (YiYi^)2 مقدار مربع خطای هر داده را محاسبه می‌کند. پس MSE میانگین مربع خطاها است.

تخمین‌گر

MSE از یک تخمین‌گر θ^با توجه به پارامتر نامعلوم θبه صورت زیر تعریف می‌شود:

.MSE(θ^)=Eθ^[(θ^θ)2]

این تعریف وابسته به پارامتر نامعلوم و MSE یک ویژگی برای تخمین‌گر است. از آنجا که MSE امید ریاضی است پس نمی‌تواند متغیر تصادفی باشد. MSE می‌تواند یک تابع از پارامترهای نامشخص باشد که در این صورت هر تخمین‌گر MSE یک تابع داده بر اساس تخمین پارامترها است، پس یک متغیر تصادفی است. این شاخص را می‌تواند به صورت جمع واریانس تخمین‌گر و مربع بایاس نیز نوشت:

MSE(θ^)=Varθ^(θ^)+Bias(θ^,θ)2.

رابطه با واریانس و بایاس یک برآوردگر

در زیر اثبات رابطه میانگین توان دوم خطاها با واریانس و بایاس یک برآوردگر آورده شده‌است.[۱]

MSE(θ^)=Eθ^[(θ^θ)2]=Eθ^[(θ^Eθ^[θ^]+Eθ^[θ^]θ)2]=Eθ^[(θ^Eθ^[θ^])2+2(θ^Eθ^[θ^])(Eθ^[θ^]θ)+(Eθ^[θ^]θ)2]=Eθ^[(θ^Eθ^[θ^])2]+Eθ^[2(θ^Eθ^[θ^])(Eθ^[θ^]θ)]+Eθ^[(Eθ^[θ^]θ)2]=Eθ^[(θ^Eθ^[θ^])2]+2(Eθ^[θ^]θ)Eθ^[θ^Eθ^[θ^]]+(Eθ^[θ^]θ)2Eθ^[θ^]θ=const.=Eθ^[(θ^Eθ^[θ^])2]+2(Eθ^[θ^]θ)(Eθ^[θ^]Eθ^[θ^])+(Eθ^[θ^]θ)2Eθ^[θ^]=const.=Eθ^[(θ^Eθ^[θ^])2]+(Eθ^[θ^]θ)2=Varθ^(θ^)+Biasθ^(θ^,θ)2

رگرسیون

در فارسی "وایازش" خوانده می شود.

در تجزیه و تحلیل رگرسیون، این شاخص گاهی برای مقدار غیربایاس واریانس خطا مورد استفاده قرار می‌گیرد و این به معنای باقیمانده تقسیم مربعات بر درجه آزادی است. در تجزیه و تحلیل رگرسیون از MSE به عنوان میانگین خطای مربع پیش‌بینی یا خطای مربع میانگین بیرون از نمونه یاد می‌شود و این می‌تواند اشاره ای به میانگین مقدار انحراف مربعات پیش‌بینی‌ها از مقادیر واقعی داشته باشد. این را می‌توان در یک فضای آزمایش خارج از نمونه بررسی کرد.

مثال‌ها

میانگین

فرض کنید یک نمونه تصادفی nتایی از X1,,Xnداشته باشیم. این نمونه‌ها را از جامعه ای انتخاب کردیم که واحدهای نمونه با جایگزینی انتخاب شده‌اند. این واحدها در یک زمان انتخاب شده‌اند و واحدهای قبلاً انتخاب شده نیز هنوز معتبر هستند. در این حالت تخمین‌گر معمولی برای μ میانگین نمونه است:

X¯=1nΣi=1nXi

که مقدار مورد انتظار برابر با میانگین واقعی است و MSE برابر است با:

MSE(X¯)=E[(X¯μ)2]=(σn)2=σ2n.

جایی که σ2واریانس جامعه است.

برای توزیع گوسی این بهترین تخمین‌گر غیربایاس است.

واریانس

تخمین‌گر معمولی برای واریانس، واریانس نمونه تصحیح شده‌است:

Sn12=1n1i=1n(XiX)2=1n1(i=1nXi2nX2).

و MSE:

MSE(Sn12)=1n(μ4n3n1σ4)=1n(γ2+2nn1)σ4

که در آن μ4چهارمین نقطه توزیع مرکزی یا جامعه است.

با این حال می‌توان از تخمین‌گرهای دیگری برای σ2استفاده کرد که متناسب با Sn12هستند و یک انتخاب مناسب همیشه می‌تواند کمترین میزان خطای مینگین مربع را داشته باشد. اگر داشته باشیم:

Sa2=n1aSn12=1ai=1n(XiX)2

آنگاه:

MSE(Sa2)=E[(n1aSn12σ2)2]=E[(n1)2a2Sn142(n1aSn12)σ2+σ4]=(n1)2a2E[Sn14]2(n1a)E[Sn12]σ2+σ4=(n1)2a2E[Sn14]2(n1a)σ4+σ4E[Sn12]=σ2=(n1)2a2(γ2n+n+1n1)σ42(n1a)σ4+σ4E[Sn14]=MSE(Sn12)+σ4=n1na2((n1)γ2+n2+n)σ42(n1a)σ4+σ4

و این دارای کمترین مقدار است زمانی که:

a=(n1)γ2+n2+nn=n+1+n1nγ2.

در یک توزیع گوسی زمانی که γ2=0میزان MSE به حداقل می‌رسد.

توزیع گوسی

در جدول زیر می‌توانید چندین تخمین‌گر از مقادیر صحیح جامعه برای حالت گوسی ببینید.

مقدار واقعی تخمین‌گر خطای میانگین مربعات
θ=μ θ^ =تخمین‌گر بدون سوگیری میانگین، X=1ni=1n(Xi) MSE(X)=E((Xμ)2)=(σn)2
θ=σ2 θ^ = تخمین‌گر بدون سوگیری واریانس، Sn12=1n1i=1n(XiX)2 MSE(Sn12)=E((Sn12σ2)2)=2n1σ4
θ=σ2 θ^ = تخمین‌گر بدون سوگیری واریانس، Sn2=1ni=1n(XiX)2 MSE(Sn2)=E((Sn2σ2)2)=2n1n2σ4
θ=σ2 θ^ = تخمین‌گر بدون سوگیری واریانس، Sn+12=1n+1i=1n(XiX)2 MSE(Sn+12)=E((Sn+12σ2)2)=2n+1σ4

مطالب مرتبط

منابع

الگو:پانویس

الگو:شاخص‌های ارزشیابی یادگیری ماشینی