توزیع دیریکله—چندجمله‌ای

از testwiki
پرش به ناوبری پرش به جستجو

توزیع دیریکله-چندجمله‌ای یک توزیع گسسته چندجمله‌ای است. این توزیع نام‌های دیگری نیز دارد؛ از جمله Dirichlet compound multinomial distribution (DCM) یا multivariate Pólya distribution(که پس از جورج پولیا نام‌گذاری شده است) در این توزیع بردار p از یک توزیع دیریکله با پارامترهای α نمونه برداری شده است. مجموعه مقادیر گسسته از توزیع دسته‌ای با بردار احتمالات p به‌دست می‌آیند.

تابع جرم احتمال

فرض کنیم N نمونه برداری تصادفی مستقل از یک توزیع دسته ای با K دسته انجام می‌دهیم. فرض کنیم مقادیر تصادفی را با zn به ازای مقادیر n=1N نشان دهیم. فرض بخواهیم تعداد دفعاتی که کلاس k (به ازای k=1K)دیده شده است را با nk نشان دهیم. می‌دانیم knk=N. به این مسئله می‌توان به دو شیوهٔ معادل نگاه کرد:

  1. مجموعه ای از N متغیر با توزیع دسته ای.
  2. بردار 𝐱=(n1,,nK) توزیع شده با توجه به توزیع چندجمله‌ای.

اکنون می‌توان روی این پارامتر این توزیع‌ها، یعنی p، توزیعی دیکله تجسم کرد و با انتگرال‌گیری نسبت به آن، توزیع پسین را به‌دست آورد. اگرچه دو دید فوق معادل هستند، اما با در نظر گرفتن هر کدام می‌توان توزیع پسین متفاوتی به‌دست آورد.

مجموعه ای از مشاهدات

توزیع مشترک

به ازای متغیر دسته ای =z1,,zN توزیع احتمال مشترک حاشیه ای عبارت است از:

Pr(α)=𝐩Pr(𝐩)Pr(𝐩α)d𝐩

که منجر به فرمول زیر می‌شود:

Pr(α)=Γ(A)Γ(N+A)k=1KΓ(nk+αk)Γ(αk)

که در آن Γ تابع گاما است.

A=kαk and N=knk, and where nk=number of zn's with the value k.

توزیع‌های مرتبط

توزیع معادل یک بعدی این توزیع توزیع بتا-دو جمله ای نام دارد.

کاربردها

جستارهای وابسته

منابع

الگو:پانویس الگو:چپ‌چین

الگو:پایان چپ‌چین الگو:دیریکله