تصمیم بهینه

از testwiki
نسخهٔ تاریخ ۲۰ اوت ۲۰۱۸، ساعت ۰۳:۰۹ توسط imported>HujiBot (ربات: جایگزینی پیوند جادویی شابک با الگو شابک)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

در تئوری تصمیم‌گیری یک تصمیم بهینه، آن تصمیمی است که تصمیمات قابل دسترس به جز آن به نتیجه بهتری منجر نشود. برای مقایسه نتایج مختلف، معمولاً مطلوبیت‌های نسبی را به هریک از آن‌ها منتسب می‌کند. اگر نتیجه همراه با نااطمینانی باشد، تصمیم بهینه، مطلوبیت (متوسط) انتظاری را حداکثر می‌کند.

گاه، مسئله هم‌ارز حداقل‌سازی زیان را در نظر می‌گیرند، به‌ویژه در موقعیت‌های مالی، که در آن مطلوبیت، به‌عنوان نفع اقتصادی تعریف می‌شود.

مطلوبیت تنها یک اصطلاح دلخواه برای کمی کردن میزان مطلوب‌بودن نتیجه یک تصمیم خاص است و لزوماً به سودمندی آن مربوط نمی‌شود. در مواردی که نتیجه همراه با نااطمینانی باشد، تصمیم بهینه مطلوبیت انتظاری را حداکثر می‌کند.

مسئله یافتن تصمیم بهبنه، یک مسئله بهینه‌سازی ریاضی است. در عمل، افراد معدودی، بهینه‌بودن تصمیمات خود را بررسی می‌کنند، درعوض از رهیافت‌های شهودی‌تر برای یافتن تصمیماتی که «به اندازه کافی خوب» هستند، استفاده می‌کنند.

دلایل نوعی، برای یک رهیافت صوری‌تر زمانی پدیدار می‌شود که تصمیم چنان مهم است که زمانی برای تحلیل آن صرف شود، و در عین حال با رهیافت‌های شهودی ساده، حل آن پیچیده خواهد شد.

صورت ریاضی

هر تصمیم d از مجموعه گزینه‌های تصمیم در دسترس D منجر به برآمد (o=f(d خواهد شد. همه برآمدهای ممکن از مجموعه O است. به هر برآمد، مطلوبیت (UO(o نسبت داده می‌شود، پس می‌توان برای هر تصمیم خاص d مطلوبیت را به شکل زیر تعریف کرد

UD(d) = UO(f(d))

می‌توان تصمیم بهینه doptرا اینگونه تعریف کرد که (UD(dرا حداکثر می‌کند.

dopt=argmax\limits dDUD(d)

حل مسئله می‌تواند به سه گام تقسیم شود:

  1. پیش‌بینی برآمد o از هر تصمیم d
  2. نسبت دادن مطلوبیت (UO(o به هر برآمد o
  3. یافتن تصمیم d که (UD(d را ماکزیمم می‌کند

برآمد همراه نااطمینانی

در این حالت، پیش‌بینی قطعی برآمد تصمیمی خاص ممکن نیست، رهیافت احتمالی لازم است. شکل عمومی آن را به این شرح می‌توان بیان کرد: برای تصمیم مفروض d، توزیع احتمال برآمدهای ممکن با چگالی احتمال شرطی (p(o|d داده می‌شود، و بنابراین می‌توان مطلوبیت انتظاری تصمیم d را به شکل زیر محاسبه کرد:

UD(d)=p(o|d)U(o)do   

که انتگرال بر کل مجموعه O گرفته شده است. در این صورت تصمیم بهینه dopt آنست که (UD(d این تعریف را حداکثر کند.

dopt=argmax\limits dDUD(d)

منابع

الگو:پانویس