تعادل همبسته

از testwiki
پرش به ناوبری پرش به جستجو

در تئوری بازی، تعادل همبسته یک مفهوم راه حل است که عمومی تر از تعادل شناخته شده نش است. این تعادل اولین بار توسط ریاضیدان رابرت آومان در سال ۱۹۷۴ بررسی شد.[۱][۲] در این تعادل هر بازیکن حرکت خود را بر اساس مشاهده اش از یک سیگنال عمومی (متغیر تصادفی مشترک) ، انتخاب می‌کند. هر راهبرد یک عمل را به هر مشاهده احتمالی بازیکن از سیگنال نسبت می‌دهد. اگر هیچ بازیکنی تمایل به انحراف از راهبرد توصیه شده نداشته باشد (با فرض عدم انحراف دیگران)، توزیع را تعادل همبسته می‌نامند.

تعریف رسمی

یک بازی راهبردی با N بازیکن (N,Ai,ui) با یک مجموعه راهبرد Ai و یک تابع مطلوبیت ui برای هر بازیکن i تعریف می‌شود. وقتی بازیکن i راهبردaiAi را انتخاب و باقی بازیکنان راهبرد ai را انتخاب می‌کنند، مطلوبیت بازیکن i برابر با ui(ai,ai) خواهد بود.

تغییر راهبرد برای بازیکن i با تابع: ϕi:AiAi تعریف می‌شود. تابع ϕi به بازیکن i می‌گوید تا رفتار خود را با عمل ϕi(ai) هنگامی که دستور بازی ai داده می‌شود تعویض کند.

فرض کنید که (Ω,π) یک فضای احتمال شمارا باشد. برای هر بازیکن i ، Pi پارتیشن اطلاعات این بازیکن ، qi احتمال بسین i و si:ΩAi همان مقدار موجود در Pi که متناسب با هر رخداد است را اختصاص می‌دهد. در این صورت ((Ω,π),Pi,si) یک تعادل همبسته برای بازی راهبردک(N,Ai,ui) است اگر برای هر بازیکن i و هر تغییر راهبرد ϕi نامساوی زیر برقرار باشد:

ωΩqi(ω)ui(si(ω),si(ω))ωΩqi(ω)ui(ϕi(si(ω)),si(ω))

به عبارت دیگر، ((Ω,π),Pi) یک تعادل همبسته است اگر هیچ بازیکنی نتواند مطلوبیت مورد انتظار خود را از طریق تغییر راهبرد بهبود بخشد.

یادگیری تعادل همبسته

یکی از مزایای تعادل‌های همبسته این است که از نظر محاسباتی از تعادل نش هزینه کمتری دارند. یک روش توجیه این مزیت این است که محاسبه یک تعادل همبسته فقط به حل یک برنامه‌ریزی خطی نیاز دارد در حالی که حل تعادل نش مساوی با یافتن یک نقطه ثابت است.[۳]

منابع

الگو:پانویس

منابع