توزیع حاشیه‌ای

از testwiki
پرش به ناوبری پرش به جستجو

در نظریه آمار و احتمال، توزیع حاشیه‌ای از یک زیرمجموعه از یک مجموعه ای از متغیرهای تصادفی، توزیع احتمال از متغیرهای موجود در زیر مجموعه هست. احتمال مقادیر مختلف متغیرها را در زیرمجموعه بدون مراجعه به مقادیر سایر متغیرها ارائه می‌دهد. در حالی که توزیع شرطی، احتمالات را مشروط به مقادیر متغیرهای دیگر می‌کند.

متغیرهای حاشیه‌ای آن متغیرها در زیرمجموعه متغیرهایی هستند که حفظ می‌شوند. این مفاهیم «حاشیه‌ای» هستند زیرا با جمع کردن مقادیر در جدول در امتداد سطرها یا ستون‌ها و نوشتن حاصل جمع در حاشیه جدول، می‌توان آنها را یافت.[۱] توزیع متغیرهای حاشیه‌ای (توزیع حاشیه‌ای) توسط حاشیه سازی حاصل می‌شود، یعنی تمرکز روی مبالغ موجود در حاشیه بیش از توزیع متغیرهای کنار گذاشته شده‌است، و گفته می‌شود که متغیرهای دور انداخته شده، به حاشیه رانده شده‌اند.

به‌طور ساده‌تر گاهی نیاز داریم توزیع مستقل دو متغیر تصادفی را هم از توزیع توأم به دست آوریم. جواب این سؤال ما در توزیع حاشیه‌ای نهفته‌است.

تعریف

برای حساب کردن توزیع حاشیه‌ای یکی از این متغیرها کافی است به نوعی تأثیر آنرا بر روی تابع توزیع توأم حذف کنیم.

تابع جرم احتمال حاشیه‌ای

فرض کنید توزیع توأم[۲] دو متغیر تصادفی گسسته الگو:Mvar و الگو:Mvar به ما داده شده‌است. توزیع حاشیه‌ای هر یک از این متغیرها - به عنوان مثال الگو:Mvar - برابر است با توزیع احتمال الگو:Mvar هنگامی که مقادیر الگو:Mvar در نظر گرفته نمی‌شوند. این را می‌توان با جمع کردن احتمال توزیع توأم روی تمام حالات الگو:Mvar محاسبه کرد. به‌طور مشابه، برای عکس آن نیز درست است؛ یعنی توزیع حاشیه‌ای الگو:Mvar را نیز می‌توان با جمع کردن احتمال توزیع توأم روی حالات الگو:Mvar محاسبه کرد. الگو:چپ‌چین

pX(xi)=jp(xi,yj)
pY(yj)=ip(xi,yj)

الگو:پایان چپ‌چین

الگو:چپ‌چین

الگو:Diagonal split header x1 x2 x3 x4 pY(y) ↓
y1 الگو:Sfrac الگو:Sfrac الگو:Sfrac الگو:Sfrac الگو:Sfrac
y2 الگو:Sfrac الگو:Sfrac الگو:Sfrac الگو:Sfrac الگو:Sfrac
y3 الگو:Sfrac 0 0 0 الگو:Sfrac
pX(x) → الگو:Sfrac الگو:Sfrac الگو:Sfrac الگو:Sfrac الگو:Sfrac
الگو:Nobold

الگو:پایان چپ‌چین

احتمال حاشیه‌ای می‌تواند به صورت امید ریاضی نیز نوشته شود. الگو:چپ‌چین pX(x)=ypXY(xy)pY(y)dy=EY[pXY(xy)] الگو:پایان چپ‌چین

به‌طور شهودی احتمال حاشیه‌ای الگو:Mvar با بررسی احتمال شرطی الگو:Mvar به شرط مقدار خاصی از الگو:Mvar، و سپس میانگین این احتمال شرطی بر روی توزیع همه مقادیر الگو:Mvar محاسبه می‌شود.

این از تعریف امید ریاضی (بعد از انجام قانون LOTUS) می‌آید.

EY[f(Y)]=yf(y)pY(y)dy

تابع چگالی احتمال حاشیه‌ای

فرض کنید توزیع توأم دو متغیر تصادفی پیوسته الگو:Mvar و الگو:Mvar به ما داده شده‌است. تابع چگالی احتمال حاشیه‌ای الگو:Mvar را می‌توان از انتگرال احتمال توزیع توأم روی تمام حالات الگو:Mvar محاسبه کرد.

الگو:چپ‌چین

fX(x)=+f(x,y)dy
fX(y)=+f(x,y)dx

الگو:پایان چپ‌چین

و یا به‌طور شهودی تر داریم:

الگو:چپ‌چین

fX(x)=cdf(x,y)dy
fX(y)=abf(x,y)dx
x[a,b],y[c,d]

الگو:پایان چپ‌چین

تابع توزیع تجمعی حاشیه‌ای

به راحتی می‌توان تابع توزیع تجمعی حاشیه‌ای را از روی تابع چگالی احتمال حاشیه‌ای به دست آورد.

تابع توزیع تجمعی حاشیه‌ای متغیر تصادفی گسسته

برای متغیرهای تصادفی گسسته داریم:

F(x,y)=P(Xx,Yy)

تابع توزیع تجمعی حاشیه‌ای متغیر تصادفی پیوسته

برای متغیرهای تصادفی پیوسته داریم:

F(x,y)=axcyf(x,y)dydx

حال فرض کنید می‌خواهیم توزیع تجمعی حاشیه‌ای یک متغیر تصادفی را از روی توزیع تجمعی توأم بدون استفاده از تابع چگالی آنها بدست آوریم.

FX(x)=FX,Y(x,)=limxFXY(x,y)

توزیع احتمال حاشیه‌ای و توزیع احتمال شرطی

تعریف

احتمال حاشیه‌ای، احتمال رخ دادن یک رخداد مستقل از رخدادهای دیگر است. از سمت دیگر احتمال شرطی، احتمال رخ دادن یک رخداد به شرطی که رخدادهای مشخص دیگری اتفاق افتاده باشند است. این بدین معنا است که در چنین احتمالی محاسبات مربوط به یک متغیر تصادفی به محاسبات متغیرهای تصادفی دیگر وابسته می‌باشد.[۳]

توزیع احتمال شرطی یک متغیر تصادفی به شرط رخ دادن متغیر تصادفی دیگر معادل توزیع احتمال توأم هر دو متغیر تصادفی تقسیم بر توزیع احتمال حاشیه‌ای متغیر تصادفی دیگری است که بالاتر معرفی شد می‌باشد.[۴] پس داریم،

pY|X(y|x)=P(Y=yX=x)=P(X=x,Y=y)PX(x)

  • برای متغیرهای تصادفی پیوسته،

fY|X(y|x)=fX,Y(x,y)fX(x)

مثال

فرض کنید داده‌های مربوط به دانشجویان یک کلاس ۲۰۰ نفری را داریم. این داده‌ها شامل میزان زمان مطالعه دانشجویان (X) و درصد جواب‌های درست دانشجویان در امتحان (Y) هستند.[۵] فرض کنید که X و Y متغیرهای تصادفی گسسته هستند؛ توزیع احتمال توأم X و Y را می‌توان با استفاده از لیست کردن تمام مقادیر ممکن p(xi,yj) همانند جدول پایین، تعریف کرد.

الگو:چپ‌چین

الگو:Diagonal split header میزان زمان مطالعه (دقیقه)
% جواب‌های درست x1 (0-20) x2 (21-40) x3 (41-60) x4(>60) pY(y) ↓
y1 (0-20) الگو:Sfrac 0 0 الگو:Sfrac الگو:Sfrac
y2 (21-40) الگو:Sfrac الگو:Sfrac الگو:Sfrac 0 الگو:Sfrac
y3 (41-59) الگو:Sfrac الگو:Sfrac الگو:Sfrac الگو:Sfrac الگو:Sfrac
y4 (60-79) 0 الگو:Sfrac الگو:Sfrac الگو:Sfrac الگو:Sfrac
y5 (80-100) 0 الگو:Sfrac الگو:Sfrac الگو:Sfrac الگو:Sfrac
pX(x) → الگو:Sfrac الگو:Sfrac الگو:Sfrac الگو:Sfrac 1
الگو:Nobold

الگو:پایان چپ‌چین توزیع احتمال حاشیه‌ای می‌تواند تعداد دانشجوهایی که نمره ۲۰ یا کمتر گرفته‌اند را مشخص کند:

pY(y1)=PY(Y=y1)=i=14P(xi,y1)=2200+8200=10200، یعنی ۱۰ دانشجو یا ۵ درصد دانشجویان.

توزیع احتمال شرطی برای مشخص کردن احتمال اینکه یک دانشجو که ۶۰ دقیقه یا بیشتر مطالعه کرده باشد، نمرهٔ ۲۰ یا پایین‌تر کسب کند به کار می‌رود:

pY|X(y1|x4)=P(Y=y1|X=x4)=P(X=x4,Y=y1)P(X=x4)=8/20070/200=870=435، این عبارت به این معنی است که ۱۱ درصد احتمال این وجود دارد که نمره دانشجو پس از حداقل ۶۰ دقیقه مطالعه، ۲۰ شود.

نمونه ای از دنیای واقعی

فرض کنید احتمال برخورد یک عابر پیاده با ماشین در حین عبور از جاده در گذرگاه عابر پیاده بدون توجه به چراغ راهنمایی محاسبه شود. فرض کنید الگو:Mvar یک متغیر تصادفی گسسته باشد که یک مقدار از {Hit, Not Hit} را می‌گیرد. فرض کنید L (برای چراغ راهنمایی) یک متغیر تصادفی گسسته باشد که یک مقدار از {RED, YELLOW, GREEN} را می‌گیرد.

در واقع، H به L وابسته خواهد بود؛ یعنی P(H = Hit) بسته به قرمز، زرد یا سبز بودن L مقادیر متفاوتی خواهد گرفت (و به همین ترتیب برای P(H = Not Hit)). برای مثال، یک عابر زمانی که چراغ‌های راهنمایی سبز هستند، احتمال بیشتری وجود دارد که هنگام عبور با خودرو برخورد کند تا زمانی که قرمز باشد. به عبارت دیگر، برای هر جفت مقادیر ممکن معینی برای H و L، باید احتمال توزیع توأم H و L را در نظر گرفت تا در صورت نادیده گرفتن حالت چراغ راهنمایی توسط عابر، احتمال وقوع آن جفت رویدادها با هم پیدا شود.

هرچند، در تلاش برای محاسبه احتمال حاشیه‌ای P(H = Hit)، آنچه مورد نظر است، احتمال برخورد H = Hit در شرایطی است که مقدار خاص L ناشناخته است و در آن عابر پیاده وضعیت چراغ راهنمایی را نادیده می‌گیرد. به‌طور کلی، اگر چراغ‌ها قرمز باشد یا اگر چراغ‌ها زرد یا اگر چراغ‌ها سبز باشند، می‌توان به عابر پیاده ضربه زد؛ بنابراین، پاسخ احتمال حاشیه‌ای را می‌توان با جمع P(H | L) برای همه مقادیر ممکن L، با وزن هر مقدار L با احتمال وقوع آن یافت.

در اینجا جدولی وجود دارد که بسته به وضعیت چراغ‌ها، احتمالات مشروط ضربه خوردن را نشان می‌دهد. (توجه داشته باشید که ستون‌های این جدول باید تا ۱ جمع شوند زیرا بدون توجه به وضعیت نور، احتمال اصابت یا عدم اصابت ۱ است)

Conditional distribution: P(HL)
الگو:Diagonal split header Red Yellow Green
Not Hit 0.99 0.9 0.2
Hit 0.01 0.1 0.8

برای یافتن توزیع احتمال توأم، داده‌های بیشتری مورد نیاز است. برای مثال، فرض کنید P(L = red) = ۰٫۲ و P(L = yellow) = ۰٫۱ و P(L = green) = ۰٫۷. ضرب هر ستون در توزیع شرطی در احتمال وقوع آن ستون منجر به توزیع احتمال توأم H و L می‌شود که در مستطیل ۲×۳ وسط داده شده‌است.

Joint distribution: الگو:Tmath
الگو:Diagonal split header Red Yellow Green Marginal probability P(H)
Not Hit 0.198 0.09 0.14 0.428
Hit 0.002 0.01 0.56 0.572
Total 0.2 0.1 0.7 1

احتمال حاشیه‌ای P(H = Hit) مجموع ۰٫۵۷۲ در امتداد ردیف H = Hit این جدول توزیع مشترک است، زیرا این احتمال برخورد زمانی است که چراغ‌ها قرمز یا زرد یا سبز هستند. به‌طور مشابه، احتمال حاشیه‌ای که P(H = Not Hit) مجموع در امتداد ردیف H = Not Hit است.

توزیع احتمال‌های چند متغیره

تعدادی نمونه از یک توزیع احتمال نرمال دو متغیره. توزیع احتمال‌های حاشیه‌ای قرمز و آبی به نمایش درآمده‌اند. توزیع احتمال حاشیه‌ای X بوسیله یک هیستوگرام از مختصات X بدون در نظر گرفتن مختصات Y به نمایش درآمده است.

برای توزیع احتمال‌های چند متغیره، همان فرمولی را به کار می‌گیریم که بالاتر از آن استفاده کردیم با این تفاوت که در این‌جا نمادهای X و/یا Y به عنوان بردار شناخته می‌شوند. به‌طور خاص می‌توان گفت که هر جمع یا انتگرال بر روی تمام متغیرها، بجز متغیرهایی که در X قرار دارند، اعمال می‌شود.[۶] یعنی، اگر X1,X2,…,Xn متغیرهای تصادفی گسسته باشند، آنگاه تابع جرم احتمال حاشیه‌ای باید به شکل زیر تعریف شود:

pXi(k)=p(x1,x2,,xi1,k,xi+1,,xn);

اگر X1,X2,…,Xn متغیرهای تصادفی پیوسته باشند، آنگاه تابع چگالی احتمال حاشیه‌ای باید به شکل زیر تعریف شود:

fXi(xi)=f(x1,x2,,xn)dx1dx2dxi1dxi+1dxn.

جستارهای وابسته

پانویس

الگو:پانویس

منابع

الگو:چپ‌چین

الگو:پایان چپ‌چین

الگو:توزیع‌های احتمالات الگو:آمار