توزیع دیریکله

از testwiki
نسخهٔ تاریخ ۹ دسامبر ۲۰۲۱، ساعت ۱۰:۲۱ توسط imported>Romeo.kh (growthexperiments-addlink-summary-summary:3|0|0)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

الگو:Probability distribution

چندین تصویر توزیع دریکله وقتی که K=3 برای بردارهای مختلف پارامتر α است. به‌صورت ساعتگرد از بالا چپ: α=(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4).

توزیع دیریکله در نظریه احتمال و آمار یک توزیع پیوسته است. این توزیع به‌طور کلی حالت گسترش یافته توزیع بتا برای توابع چندمتغیره است. معمولاً از توزیع دیریکله به عنوان توزیع پیشین در مدل سازی بیزی استفاده می‌شود؛ چرا که توزیع دیریکله مزدوج پیشین (conjugate prior) برای توزیع چندجمله ای و توزیع دسته ای (categorical) است. تعمیم این توزیع فرایند دیریکله است.

تعریف ریاضی

تابع چگالی احتمال آن به صورت زیر است:

f(x1,,xK1;α1,,αK)=1B(α)i=1Kxiαi1

به ازای همهٔ x1, ..., xK–1> 0 بطوریکه x1 + ... + xK–1 < 1, و xK = 1 – x1 – ... – xK–1. چگالی در خارج از این ناحیه صفر است. ثابت نرمالیزاسیون به صورت زیر تعریف می‌شود:

B(α)=i=1KΓ(αi)Γ(i=1Kαi),α=(α1,,αK).

حالت های خاص

یک حالت خاص زمانی است که تمامی مقادیر α مقدار یکسانی داشته باشند، که در اینصورت آن را توزیع دیریکلهٔ متقارن می نامیم. در این حالت توزیع ساده می‌شود به:

f(x1,,xK1;α)=Γ(αK)Γ(α)Ki=1Kxiα1.

زمانی که α=1 توزیع معادل با توزیع یکنواخت روی یک تکیه‌گاه (ریاضی) سیمپلکس K1 بعدی.

ویژگی ها

گشتاورها

فرض کنیم متغیرهای تصادفی X=(X1,,XK)Dir(α) و  :XK=1X1XK1. را در اختیار داریم. تعریف می‌کنیم α0=i=1Kαi. بنابرین [۱][۲]

E[Xi]=αiα0,
Var[Xi]=αi(α0αi)α02(α0+1).

علاوه بر این اگر if ij

Cov[Xi,Xj]=αiαjα02(α0+1).

مد

مد توزیع برداری مانند (x1, ..., xK) است که در آن:

xi=αi1α0K,αi>1.

توزیع حاشیه ای

توزیع‌های حاشیه ای توزیع دیریکله، توزیع بتا هستند.

مزدوج برای توزیع چندجمله ای/دسته ای

این به این معنی است که اگر در مدلسازی مجموعه ای از داده ها از توزیع چندجمله ای/دسته ای استفاده کنیم و توزیع پیشین را دیریکله قرار دهیم، توزیع پسین الزاماً یک توزیع دیریکله خواهد بود. به زبان ریاضی یعنی

α=(α1,,αK)=concentration hyperparameter𝐩α=(p1,,pK)Dir(K,α)𝕏𝐩=(𝐱1,,𝐱N)Cat(K,𝐩)

بنابرین روابط مقابل برقرار هستند:

𝐜=(c1,,cK)=number of occurrences of category i𝐩𝕏,αDir(K,𝐜+α)=Dir(K,c1+α1,,cK+αK)

ارتباط با توزیع دیریکله-چندجمله ای

آنتروپی

می دانیم

E[log(Xi)]=ψ(αi)ψ(α0)
و
Cov[log(Xi),log(Xj)]=ψ(αi)δijψ(α0)

که در آن ψ تابع تابع دایگاما و ψ تابع ترایگاما، δij دلتای کرونکر است.

H(X)=logB(α)+(α0K)ψ(α0)j=1K(αj1)ψ(αj)

ادغام پارامترها

اگر X=(X1,,XK)Dir(α1,,αK) اگر متغیرهای تصادفی i-ام و j-م را با هم ادغام کنیم دیریکلهٔ حاصل برابر است با:

X=(X1,,Xi+Xj,,XK)Dir(α1,,αi+αj,,αK).

منابع

الگو:پانویس

  1. http://www.cis.hut.fi/ahonkela/dippa/node95.html

الگو:توزیع‌های احتمالات الگو:دیریکله