مطلوبیت دسته

مطلوبیت دسته معیاری از "خوبی دسته" است که در الگو:Harvard citation text و الگو:Harvard citation text تعریف شده است. مطلوبیت دسته سعی می‌کند احتمال اینکه دو شی در یک دسته دارای مقادیر مشخصه مشترک هستند و همینطور احتمال اینکه اشیاء از دسته‌های مختلف دارای مقادیر مشخصه متفاوت هستند را به حداکثر برساند. این در نظر گرفته شده بود تا معیارهای محدودتری از خوبی دسته را جایگزین کند، مانند "اعتبار علامت " ( الگو:Harvard citation no brackets ; الگو:Harvard citation no brackets ) و "شاخص تطبیق" الگو:Harvard citation . این یک معیار اصولی نظریه اطلاعات از مزیت پیشگویانه به‌دست‌آمده توسط ناظری که از ساختار طبقه‌بندی داده شده (یعنی برچسب‌های کلاس از نمونه‌ها) نسبت به ناظری که دانشی از ساختار طبقه‌بندی ندارد به دست می‌آورد. از این نظر، انگیزه برای معیار مطلوبیت دسته مشابه معیار به دست آوردن اطلاعات مورد استفاده در یادگیری درخت تصمیم گیری است . در برخی ارائه ها، رسما معادل اطلاعات متقابل است، همانطور که در زیر مورد بحث قرار می گیرد. مروری بر مطلوبیت دسته در تجسم احتمالی آن، با کاربردهایی در یادگیری ماشین ، در الگو:Harvard citation text .

تعریف نظری-احتمال مطلوبیت دسته

تعریف نظری-احتمال مطلوبیت دسته در الگو:Harvard citation text و الگو:Harvard citation text به شرح زیر است:

C U (C, F) = \frac{1}{p} \sum_{c_{j} \in C} p (c_{j}) [\sum_{f_{i} \in F} \sum_{k = 1}^{m} p (f_{i k} | c_{j})^{2} - \sum_{f_{i} \in F} \sum_{k = 1}^{m} p (f_{i k})^{2}]

جایی که $F = {f_{i}}, i = 1 \dots n$ یک اندازه است - $n$ مجموعه از $m$ ویژگی های آری و $C = {c_{j}} j = 1 \dots p$ مجموعه از $p$ دسته بندی. عبارت $p (f_{i k})$ احتمال حاشیه‌ای را مشخص می کند که ویژگی $f_{i}$ مقدار $k$ را می گیرد، و عبارت $p (f_{i k} | c_{j})$ دسته احتمال مشروطرا مشخص می کند که ویژگی $f_{i}$ مقدار $k$ را می گیرد با توجه به اینکه شی مورد نظر به دسته $c_{j}$ تعلق دارد.

انگیزه و توسعه این عبارت برای مطلوبیت دسته و نقش چندگانه $\frac{1}{p}$ به عنوان یک کنترل بیش از حد خام، در منابع بالا آورده شده است. بی قید و شرط الگو:Harvard citation ، عبارت $p (c_{j}) \sum_{f_{i} \in F} \sum_{k = 1}^{m} p (f_{i k} | c_{j})^{2}$ تعداد مورد انتظار از مقادیر مشخصه است که می تواند توسط ناظر با استفاده از استراتژی تطبیق احتمال به همراه دانش برچسب های دسته به درستی حدس بزند، در حالی که $p (c_{j}) \sum_{f_{i} \in F} \sum_{k = 1}^{m} p (f_{i k})^{2}$ تعداد مورد انتظار مقادیر مشخصه است که می تواند توسط ناظر همان استراتژی را به درستی حدس بزند، اما بدون آگاهی از برچسب های دسته. بنابراین تفاوت آنها نشان دهنده مزیت نسبی است که ناظر با داشتن دانش از ساختار دسته بندی به دست می آورد.

تعریف نظری اطلاعات از مطلوبیت دسته

تعریف نظری اطلاعات از مطلوبیت دسته برای مجموعه ای از موجودیت ها با اندازه- $n$ مجموعه ویژگی های دودویی $F = {f_{i}}, i = 1 \dots n$ و یک دسته دودویی $C = {c, \bar{c}}$ در الگو:Harvard citation text به شرح زیر آمده است:

C U (C, F) = [p (c) \sum_{i = 1}^{n} p (f_{i} | c) \log p (f_{i} | c) + p (\bar{c}) \sum_{i = 1}^{n} p (f_{i} | \bar{c}) \log p (f_{i} | \bar{c})] - \sum_{i = 1}^{n} p (f_{i}) \log p (f_{i})

جایی که $p (c)$ احتمال پیشین یک موجودیت متعلق به دسته مثبت $c$ است (در صورت عدم وجود هرگونه اطلاعات از ویژگی)، $p (f_{i} | c)$ احتمال مشروط یک موجودیت دارای ویژگی $f_{i}$ است با توجه به اینکه این موجودیت به دسته $c$ تعلق دارد ، به همین ترتیب $p (f_{i} | \bar{c})$ احتمال مشروط یک موجودیت دارای ویژگی $f_{i}$ است با توجه به اینکه این موجودیت به دسته $\bar{c}$ تعلق دارد ، و $p (f_{i})$ احتمال پیشین یک موجودیت دارای ویژگی $f_{i}$ است (در صورت عدم وجود هرگونه اطلاعات از دسته بندی).

بینش پشت عبارت فوق به شرح زیر است: عبارت $p (c) \sum_{i = 1}^{n} p (f_{i} | c) \log p (f_{i} | c)$ هزینه (بر حسب بیت) رمزگذاری (یا انتقال) بهینه ویژگی اطلاعات را هنگامی نشان می دهد که مشخص شود اشیایی که باید توصیف شوند به دسته $c$ تعلق دارند.به طور مشابه، عبارت $p (\bar{c}) \sum_{i = 1}^{n} p (f_{i} | \bar{c}) \log p (f_{i} | \bar{c})$ هزینه (بر حسب بیت) رمزگذاری (یا انتقال) بهینه ویژگی اطلاعات را هنگامی نشان می دهد که مشخص شود اشیایی که باید توصیف شوند به دسته $\bar{c}$ تعلق دارند. بنابراین مجموع این دو عبارت در پرانتز میانگین وزنی این دو هزینه است. عبارت نهایی، $\sum_{i = 1}^{n} p (f_{i}) \log p (f_{i})$ ، هزینه (بر حسب بیت) رمزگذاری (یا انتقال) بهینه ویژگی اطلاعات را هنگامی که اطلاعات هیچ دسته ای در دسترس نیست نشان می دهد. مقدار مطلوبیت دسته، در فرمول بالا، منفی خواهد بود (؟؟؟ ).

همچنین ببینید

منابع

الگو:Refbegin

الگو:Refend

مطلوبیت دسته

فهرست

تعریف نظری-احتمال مطلوبیت دسته

تعریف نظری اطلاعات از مطلوبیت دسته

همچنین ببینید

منابع

منوی ناوبری

مطلوبیت دسته

تعریف نظری-احتمال مطلوبیت دسته

تعریف نظری اطلاعات از مطلوبیت دسته

همچنین ببینید

منابع

منوی ناوبری

جستجو