فرایند دیریکله سلسله‌مراتبی

از testwiki
پرش به ناوبری پرش به جستجو

فرایند دیریکله سلسله مراتبی یا HDP در آمار و یادگیری ماشینی یک مدل در احتمالات بیزی و آمار ناپارامتری است که قابلیت‌های بسیاری در خوشه بندی داده‌ها دارد.[۱][۲] این مدل از فرایند دیریکله برای هر دسته از داده‌ها استفاده می‌کند که دارای یک توزیع پایه مشترک هستند که آن نیز به نوبهٔ خود از یک فرایند دیریکله انتخاب شده‌است. این مدل این امکان را می‌دهد تا بعضی از شاخه دارای اشتراک‌هایی با هم داشته باشند.

مدل

این مدل مخصوص داده‌هایی است که دارای گروه‌بندی هستند، مانند آنچه در مدل عناوین وجود دارد، یعنی داده‌هایی که دارای گروه‌های مختلف هستند. یعنی مجموعه‌ای از فایل‌های متنی که هر کدام تشکیل شده از کیفی از کلمات هستند. گروه‌ها با j=1,...J مشخص می‌شوند که هرگروه تشکیل شده از داده‌های xj1,...xjn است.

در HDP توزیع پایه را با H نشان می‌دهیم که توزیع پیشین روی داده هاست و پارامتر تراکم که مقدار خوشه‌ها را کنترل می‌کند. گروه j -ام با Gj مشخص می‌شوند که توسط فرایند دیریکله بدست می‌آید: Gj|G0DP(αj,G0) که در آن αj پارامتر تراکمی مربوط به گروه مربوط است و G0 توزیع پایه مشترک بین تمام گروه هاست که خود یک فرایند دیریکله است G0DP(α0,H) با پارامتر α0 و توزیع پایه H. به ازای هر داده xji یک متغیر پنهان θji: در نظر می‌گیریم.

θji|GjGjxji|θjiF(θji)

می‌دانیم که نمونه برداری از فرایند دیریکله در حقیقت مقادیری هستند که دارای مجموع یک هستند؛ لذا می‌توان G0 را به صورت زیر نشان داد:

G0=k=1π0kδθk* که تشکیل شده از بی‌نهایت مقدار است و مجموع جرم‌های π0k برابر با یک است. خود G0 نیز به نوبهٔ خود توزیع پایه برای فرایند دیریکله مربوط به خوشه هاست. یعنی هر Gj دارای توزیع پایه G0 هستند که فرم زیر نوشته می‌شوند:

Gj=k=1πjkδθk*

xji|Gjk=1πjkF(θk*)

کاربردها

این مدل در حقیقت یک نوع تعمیم غیرپارامتری از تخصیص پنهان دیریکله است.[۱] در این مدل در حقیقت، هر گروه، یک متن است و هر خوشه یک عنوان است، طوری‌که هر متن در حقیقت مخلوطی از تعدادی عنوان است. این مدل همچنین جزئی اساسی در ساختار مدل مخفی مارکوف بینهایت است[۱] که در آن تعداد حالت‌های مخفی بی‌نهایت است و از روی داده‌های یادگرفته می‌شود (نسخه غیر-پارامتری مدل مخفی مارکوف)

تعمیم

می‌توان HDP را در جهت‌های مختلفی تعمیم داد. می‌توان فرایند دیریکله را با فرایند پیتمن-یور جایگزین کرد که فرایند پیتمن-پور سلسله مراتبی بدست خواهد آمد. سلسله مراتب در مدل می‌توان چندین مرتبه باشد.

منابع

الگو:پانویس