توزیع نرمال چندمتغیره

از testwiki
نسخهٔ تاریخ ۲ ژانویهٔ ۲۰۲۵، ساعت ۱۱:۲۵ توسط imported>InternetArchiveBot (Add 1 book for ویکی‌پدیا:تأییدپذیری (20250101sim)) #IABot (v2.0.9.5) (GreenC bot)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

در نظریه احتمال و آمار، توزیع نرمال چند متغیره، توزیع گاوسی چند متغیره، یا توزیع نرمال توأم یک تعمیم از توزیع نرمال یک بعدی (تک متغیره) به ابعاد بالاتر است. یک تعریف این است که اگر هر ترکیب خطی از k عضو یک بردار، توزیع نرمال تک متغیره داشته باشد، به یک بردار تصادفی k متغیره گفته می‌شود که به‌طور نرمال توزیع شده‌است. اهمیت آن عمدتاً از قضیه حد مرکزی چند متغیره ناشی می‌شود. برای توصیف هر مجموعه ای از متغیرهای تصادفی با ارزش حقیقی که احتمالاً همبسته اند و هر کدام حول مقداری متوسط جمع می‌شوند، اغلب از توزیع نرمال چندمتغییره استفاده می‌شود.[۱][۲]

تعاریف

علامت گذاری و پارامترسازی

توزیع نرمال چند متغیره یک بردار تصادفی k بعدی به صورت 𝐗=(X1,,Xk)T را می‌توان با نماد زیر نوشت:

𝐗  𝒩(μ,Σ),

یا برای اینکه با صراحت نشان دهیم X از بعد k است،

𝐗  𝒩k(μ,Σ),

با بردار میانگین k بعدی

μ=E[𝐗]=(E[X1],E[X2],,E[Xk])T,

و ماتریس کوواریانس k×k

Σi,j=E[(Xiμi)(Xjμj)]=Cov[Xi,Xj]

به طوری که 1i,jk. معکوس ماتریس کوواریانس را ماتریس دقت می‌نامند که به صورت 𝑸=Σ1 نمایش داده می‌شود.

بردار تصادفی نرمال استاندارد

یک بردار تصادفی حقیقی به صورت 𝐗=(X1,,Xk)T، بردار تصادفی نرمال استاندارد نامیده می‌شود اگر تمام اعضای Xn مستقل و هر کدام یک متغیر تصادفی با میانگین صفر و واریانس ۱ باشند که به‌طور نرمال توزیع شده‌اند یعنی Xn 𝒩(0,1) برای همه nها. الگو:Rp

بردار تصادفی نرمال متمرکز

یک بردار تصادفی حقیقی به صورت 𝐗=(X1,,Xk)T، بردار تصادفی نرمال متمرکز نامیده می‌شود اگر ماترس𝑨 با ابعاد k× وجود داشته باشد به طوری که 𝑨𝐙 توزیع مشابهی با 𝐗 داشته و 𝐙 یک بردار تصادفی نرمال استاندار متغیره باشد. الگو:Rp

بردار تصادفی نرمال

یک بردار تصادفی حقیقی به صورت𝐗=(X1,,Xk)T، بردار تصادفی معمولی نامیده می‌شود اگر بردار تصادفی نرمال استاندارد 𝐙 با بعد ، بردار μ با بعد k و ماتریس 𝑨 با ابعاد k× وجود داشته باشد، به طوری که 𝐗=𝑨𝐙+μ . الگو:Rp الگو:Rp

به نمادگذاری ریاضی:

𝐗  𝒩(μ,Σ)there exist μk,𝑨k× such that 𝐗=𝑨𝐙+μ for Zn 𝒩(0,1),i.i.d.

در اینجا

Σ=𝑨𝑨T

، ماتریس کوواریانس است.

در حالت انحطاط که در آن ماتریس کوواریانس منفرد است، توزیع مربوطه فاقد چگالی است. برای جزئیات بیشتر به بخش زیر مراجعه کنید. این مورد مکرراً در آمار به وجود می‌آید. برای مثال، در توزیع بردار باقیمانده در رگرسیون حداقل مربعات معمولی. Xiها به‌طور کلی مستقل نیستند. آنها را می‌توان به عنوان نتیجه اعمال ماتریس 𝑨 به مجموعه ای از متغیرهای گاوسی مستقل 𝐙 مشاهده کرد.

تعاریف معادل

تعاریف زیر معادل تعریف فوق می‌باشد. یک بردار تصادفی به فرم 𝐗=(X1,,Xk)T اگر یکی از شرایط معادل زیر را برآورده کند، دارای توزیع نرمال چند متغیره است.

  • هر ترکیب خطی به فرم Y=a1X1++akXk از اعضای آن به طور نرمال توزیع شده باشد. یعنی برای هر بردار ثابت 𝐚k ، متغیر تصادفی Y=𝐚T𝐗 دارای یک توزیع نرمال تک متغیره باشد، که در آن توزیع نرمال تک متغیره با واریانس صفر جرم نقطه ای بر میانگین آن است.
  • یک بردار μ با k بعد و یک ماتریس مثبت نیمه معین و متقارن Σ با ابعاد k×k وجود دارد، به طوری که تابع مشخصه از 𝐗 به صورت زیر می‌باشد. φ𝐗(𝐮)=exp(i𝐮Tμ12𝐮TΣ𝐮).

توزیع نرمال کروی را می‌توان به عنوان توزیع منحصربفردی توصیف کرد که در آن اجزا در هر سیستم مختصات متعامد مستقل هستند.[۳][۴]

تابع چگالی

توزیع احتمال توأم نرمال دو متغیره

مورد غیر منحط

هنگامی که ماتریس کوواریانس متقارن

Σ

، مثبت قطعی باشد به توزیع نرمال چند متغیره «غیر انحطاط» گفته می‌شود. در این حالت توزیع دارای تابع چگالی احتمال به صورت زیر است[۵]

f𝐗(x1,,xk)=exp(12(𝐱μ)TΣ1(𝐱μ))(2π)k|Σ|

جایی که

𝐱

یک بردار ستونی k بعدی حقیقی است و

|Σ|detΣ

دترمینان ماتریس

Σ

، همچنین به عنوان واریانس تعمیم یافته شناخته می‌شود. اگر

Σ

یک ماتریس

1×1

باشد، معادله بالا به معادله متناظر در توزیع نرمال تک متغیره تقلیل می‌یابد.

نسخه متقارن دایره ای توزیع نرمال مختلط شکی با کمی تفاوت دارد.

در هر مکان هندسی، مکان نقاط در فضای k -بعدی که هر کدام مقدار خاصی از چگالی را می‌دهند، یک بیضی یا تعمیم ابعاد بالاتر آن را می‌دهد. از این رو نرمال چند متغیره یک مورد خاص از توزیع‌های بیضوی است.

کمیت (𝐱μ)TΣ1(𝐱μ) به عنوان فاصله ماهالانوبیس شناخته می‌شود که نشان دهنده فاصله نقطه آزمایشی 𝐱 از میانگین μ است. توجه داشته باشید که در صورتی که k=1 ، توزیع به یک توزیع نرمال تک متغیره کاهش می‌یابد و فاصله ماهالانوبیس به قدر مطلق نمره استاندارد کاهش می‌یابد.

مورد دو متغیره

در حالت غیر منفرد ۲ بعدی (k=rank(Σ)=2تابع چگالی احتمال یک بردار [XY]′ به صورت زیر است:

f(x,y)=12πσXσY1ρ2exp(12(1ρ2)[(xμXσX)22ρ(xμXσX)(yμYσY)+(yμYσY)2])

به طوریکه که ρ همبستگی بین X و Y و σX>0 و σY>0 . در این مورد،

μ=(μXμY),Σ=(σX2ρσXσYρσXσYσY2).

در حالت دو متغیره، اولین شرط معادل برای بازسازی چند متغیره نرمال بودن را می‌توان کمتر محدود کرد، زیرا نشان دادن اینکه تعداد شمارایی از ترکیبات خطی متمایز X و Y نرمال هستند، برای نتیجه‌گیری این که بردار [XY]′ دو متغیره نرمال است کافی است.

جایگاه‌های دو متغیره ایزو چگالی رسم شده در x,y صفحه بیضی‌هایی هستند که محورهای اصلی آنها با بردارهای ویژه ماتریس کوواریانس Σ ساخته می‌شوند. (نیمه قطر اصلی و فرعی بیضی برابر است با ریشه مربع مقادیر ویژه مرتب شده).

توزیع نرمال دو متغیره متمرکز در نقطه (1,3) با انحراف از معیار ۳ در جهت تقریباً (0.878,0.478) از ۱ در جهت متعامد.

هر چه قدر مطلق پارامتر همبستگی ρ افزایش بیابد، این نقطه‌ها به سمت خط زیر فشرده می‌شوند:

y(x)=sgn(ρ)σYσX(xμX)+μY.

این به این دلیل است که این عبارت، با sgn(ρ) (که در آن sgn تابع علامت است) با ρ ، بهترین پیش‌بینی بی طرفانه خطی از Y با مقادیر داده شده از X است.

مورد منحط

اگر ماتریس کوواریانس Σ رتبه کامل نباشد، پس توزیع نرمال چند متغیره منحط است و چگالی ندارد. به‌طور دقیق تر، توزیع مذکور با توجه به اندازه لبگ k بعدی (که معیار معمولی در دوره‌های احتمال در سطح حساب دیفرانسیل و انتگرال است) چگالی ندارد. گفته می‌شود که فقط بردارهای تصادفی که توزیع آنها نسبت به یک اندازه‌گیری کاملاً پیوسته‌است، چگالی دارند (با توجه به آن اندازه). برای صحبت در مورد چگالی اما ساده‌تر است که از پرداختن به عوارض تئوری اندازه‌گیری اجتناب کنیم و به زیر مجموعه ای از rank(Σ) از مختصات 𝐱 به طوری که ماتریس کوواریانس برای این زیر مجموعه مثبت معین است توجه کنیم. سپس سایر مختصات را می‌توان به عنوان تبدیل افاینی از این مختصات انتخابی در نظر گرفت.الگو:مدرک

برای صحبت معنادار در مورد چگالی‌ها در موارد منفرد، باید یک معیار پایه متفاوت را انتخاب کنیم. با استفاده از قضیه فروپاشی می‌توانیم محدودیتی از اندازه‌گیری Lebesgue را به مقداری تعریف کنیم که زیرفضای متناظر با k که به ابعاد rank(Σ) از توزیع گاوسی پشتیبانی کند، یعنی {μ+Σ1/2𝐯:𝐯k} . با توجه به این معیار، توزیع دارای چگالی موتیف زیر است:

f(𝐱)=(det\nolimits *(2πΣ))12e12(𝐱μ)𝖳Σ+(𝐱μ)

به طوریکه که Σ+ وارون تعمیم یافته‌است و det* شبه دترمینان است.

تابع توزیع تجمعی

مفهوم تابع توزیع تجمعی در بعد ۱ را می‌توان به دو صورت به حالت چند بعدی، بر اساس مناطق مستطیلی و بیضی شکل گسترش داد.

راه اول این است که تابع توزیع تجمیعی F(𝐱) از یک بردار تصادفی 𝐗 را به عنوان احتمالی که همه اجزای 𝐗 کمتر یا مساوی با مقادیر مربوطه در بردار هستند 𝐱 تعریف کنیم:[۶]

توزیع تجمعی و چگالی احتمال
F(𝐱)=(𝐗𝐱),where 𝐗𝒩(μ,Σ).

اگرچه هیچ فرم بسته‌ای برای آن وجود ندارد F(𝐱) ، تعدادی الگوریتم وجود دارد که آن را به صورت عددی تخمین می‌زنند.[۶]

راه دیگر این است که تابع توزیع تجمیعی F(r) را به عنوان احتمال قرار گرفتن نمونه در داخل بیضی که با فاصله ماهالانوبیس r از تعمیم مستقیم انحراف معیار گاوسی قرار دارد تعریف کنیم.[۷]

منابع

الگو:پانویس