هزینه هرج‌ومرج

از testwiki
پرش به ناوبری پرش به جستجو

مفهوم هزینهٔ هرج‌ومرج (Price of Anarchy یا PoA[۱])، از مباحث اقتصاد و نظریهٔ بازی است که در آن، میزان کاهش بازدهی سیستم به دلیل خودخواهی بازیکنان بررسی می‌شود. این مفهوم در سیستم‌های گوناگون با تعریف‌های متفاوتی از بازدهی کاربرد دارد. به عنوان مثال سیستم حمل‌ونقل شهری را، که بازدهی می‌تواند رسیدن در زمان کمتر تعریف شود، بررسی کنیم. در این سیستم، یک سری بازیکن می‌خواهند از یک مبدأ به یک مقصد بروند. دو حالت وجود دارد؛ حالت اول اینکه مدیریت مرکزی وجود داشته باشد و بازیکنان با توجه به فرمان مدیریت مرکزی جهت‌های حرکت خود را انتخاب کنند (فرض می‌شود بازیکن‌ها کاملاً به فرمان‌ها گوش می‌دهند) و حالت دوم اینکه مدیریت مرکزی وجود نداشته باشد و بازیکنان به‌صورت خودخواهانه تصمیم‌های خود را بگیرند، یعنی هر بازیکن تنها بازدهی خود را در نظر بگیرد. هزینهٔ هرج‌ومرج نمایشی برای اندازه‌گیری کاهش بازدهی سیستم در حالت دوم نسبت به حالت اول است.

سیستم‌هایی که در آن‌ها به بررسی هزینهٔ هرج‌ومرج پرداخته می‌شود معمولاً به صورت یک بازی مدل می‌شوند. در یک بازی، با توجه به اینکه هر بازیکن چه استراتژی‌ای را انتخاب می‌کند، هر بازیکن میزانی سود (یا ضرر) می‌کند. بازدهی در این مدل، تابعی از سود (یا ضرر) بازیکنان با توجه به استراتژی‌های انتخاب شده‌است. یعنی کارایی آن به صورت تابعی از نتیجهٔ برهم کنش رفتار عامل‌های مختلف آن مدل می‌شود. مثلاً تعریف کارایی در سیستم حمل‌ونقل برابر معکوس ازدحام، در شبکه برابر بیشترین تأخیر (Maximum Delay) و در بازارهای حراجی (Auction) برابر سود اجتماعی تعریف می‌شود.

برای مدل کردن رفتار خودخواهانهٔ بازیکنان، می‌توان از مفاهیم تعادل در بازی‌ها استفاده کرد که یکی از پرکاربردترین تعادل‌ها، تعادل نش است. حال با توجه به اینکه از کدام نوع تعادل نش استفاده شود، نوع‌های مختلف هزینهٔ هرج‌ومرج بدست می‌آید؛ مثلاً اگر از تعادل نش خالص استفاده شود، هزینهٔ هرج‌ومرج خالص بدست می‌آید یا اگر از تعادل نش ترکیبی استفاده شود، هزینهٔ هرج‌ومرج ترکیبی بدست می‌آید و یا برای بازی‌های با اطلاعات ناقص، هزینهٔ هرج‌ومرج بیز-نش بدست می‌آید.

تعریف قیمت هرج‌ومرج ابتدا توسط کوتسوپیاس (Koutsoupias) و پاپادیمیتریو (Papadimitriou) بیان شد، در حالی که اندازه‌گیری ناکارامدی تعادل نش از دیدگاه سود اجتماعی، ایده‌ای قدیمی تر است. مفهوم قیمت هرج‌ومرج به شکل امروزی خود، به گونهٔ معادل با ضریب تقریب (Approx-ratio) در بحث الگوریتم‌های تقریبی، یا به تعبیر دیگر به صورت معادل با نسبت رقابت (Competitive-ratio) در الگوریتم‌های آنلاین تعریف شده‌است.

تعریف ریاضی

هزینهٔ هرج‌ومرج را می‌خواهیم در بازی G=(N,S,u) بررسی کنیم که N مجموعهٔ بازیکنان است، S=S1×S2×...×Sn، در واقع S مجموعهٔ استراتژی پروفایل‌ها است (Si، مجموعهٔ استراتژی‌های بازیکن iام است) و u مجموعهٔ uiها است که هر ui یک تابع است که ui:S . در واقع ui تابعی است که سود نفر iام را در هر استراتژی پروفایل بدست می‌آورد. تابع بازدهی را نیز، به صورت Welf:S تعریف می‌کنیم، که برای هر استراتژی پروفایل، یک عدد به نشان میزان بازدهی ارائه می‌دهد. حال برای Welf، می‌توان تابع‌های بهینهٔ اجتماعی در بازی‌ها را در نظر گرفت، به عنوان مثال می‌توان Welf(s)=iNui(s) (مجموع سود تمام بازیکنان در یک استراتژی پروفایل)، یا تابع Welf(s)=miniNui(s) (کمترین مقدار سود بازیکنان در یک استراتژی پروفایل) و یا هر تابعی که مقدار مطلوبی را حداکثر می‌کند را در نظر گرفت. اگر در این مدل بازی، عددها به‌جای سود بازیکنان، هزینهٔ بازیکنان تعریف شده‌باشند، در این صورت به‌جای تابع Welf، تابع Cost:S را تعریف می‌کنیم که هرچه مقدار کمتری داشته‌باشد، نشاندهندهٔ بازده بیشتری است.

اگر مجموعهٔ Equil را مجموعه‌ای از استراتژی پروفایل‌هایی بگیریم که در آن‌ها تعادل داریم (در واقع EquilS)، در این صورت هزینهٔ هرج‌ومرج (PoA) نسبت بازده در بهترین حالت از میان استراتژی پروفایل‌ها، به بدترین بازده در میان استراتژی‌های تعادل (یا همان بازده بدترین تعادل) است:

الگو:وسط‌چین PoA=maxsSWelf(s)minsEquilWelf(s) الگو:پایان وسط‌چین

در صورتی که به‌جای تابع Welf، تابع Cost داشته باشیم، در این صورت PoA به صورت زیر تعریف می‌شود:

الگو:وسط‌چین PoA=maxsEquilCost(s)minsSCost(s)الگو:پایان وسط‌چین

یکی دیگر از مفاهیم مرتبط با هزینهٔ هرج‌ومرج، هزینهٔ پایداری (Price of Stability یا PoS) است که تعریف آن نسبت بازده در بهترین حالت از میان استراتژی پروفایل‌ها، به بهترین بازده در میان استراتژی‌های تعادل (یا همان بازده بهترین تعادل) است:

الگو:وسط‌چین PoS=maxsSWelf(s)maxsEquilWelf(s) الگو:پایان وسط‌چین

مفهوم PoS به این دلیل مهم است که بهترین تعادل نش به‌طور طبیعی مفهوم پایداری را در خود دارد و زمانی که بازی در بهترین تعادل نش از لحاظ بازده باشد، احتمال اینکه بازیکنی استراتژی خود را تغییر دهد کم است.[۲]

اگر به‌جای Welf، تابع Cost تعریف شده باشد، PoS به شکل زیر تعریف می‌شود: الگو:وسط‌چین

PoS=minsEquilCost(s)minsSCost(s) الگو:پایان وسط‌چین

با توجه به این تعریف‌ها، بدیهی است که PoAPoS1 و تخمین زده‌می‌شود که از دست دادن بازده به دلیل محدودیت‌های نظریهٔ بازی، مقداری میان PoS و PoA است.

در زیر به بررسی PoA و PoS دریک مثال می‌پردازیم.

معمای زندانی

مثلاً بازی‌ای را در نظر بگیرید که جدول هزینه‌های آن به‌شکل زیر باشد:

سکوت اعتراف
سکوت ۱, ۱ ۷, ۰
اعتراف ۰, ۷ ۵, ۵

در این بازی، دو متهم همکار در یک جرم، زندانی شده‌اند و آن‌ها را به‌طور هم‌زمان و جدا از هم بازجویی می‌کنند. اگر هردو سکوت کنند و اعتراف نکنند، هر یک ۱ سال حبس می‌گیرند. اگر هر دو اعتراف کنند، هر یک ۵ سال حبس می‌گیرند و اگر یکی اعتراف کند و دیگری سکوت کند، متهمی که سکوت کرده ۱۰ سال حبس می‌گیرد و متهم دیگر آزاد می‌شود. این بازی به معمای زندانی معروف است. در این مثال تابع Cost را به شکل Cost(s1,s2)=u1(s1,s2)+u2(s1,s2) تعریف می‌کنیم. حال تنها تعادل نش در این بازی، زمانی است که هر دو بازیکن، اعتراف کنند (زیرا اگر هر بازیکن استراتژی خود را عوض کند، سودی کمتر از حالت کنونی‌اش می‌گیرد). این درحالی است که Cost زمانی که هر دو بازیکن همکاری کنند کمترین حالت است. پس:

اگر هردو بازیکن سکوت کنند: Cost1=1+1=2

اگر هردو بازیکن اعتراف کنند: Cost2=5+5=10

پس با توجه به این مقادیر، PoA=Cost2Cost1=102=5 است و چون این بازی تنها یک تعادل نش دارد، پس PoS نیز مقدارش برابر PoA می‌شود.

شبکه‌های ترافیک خودخواهانه [۳]

شکلی از مفهوم هزینهٔ هرج‌ومرج در شبکه‌های ترافیک تعریف می‌شود که در تحلیل‌های شبکه‌ها از جمله شبکهٔ ترافیک حمل‌ونقل کاربرد زیادی دارد. مدل کردن این شبکه‌ها عموماً به شکل شبکه‌های چند جریانه (Multicommodity network) صورت می‌گیرد.

یک شبکهٔ چند جریانه با یک ۳ تای (G=(V,E),S)معرفی می‌شود. G از گردایه‌ای از سفرها (Commodity) تشکیل شده‌است. هر سفر یک دوتایی (ti,si)از رأس‌های گراف است، که tiمبدا و siمقصد آن است. به ازای سفر iام، Piمجموعهٔ تمامی مسیرها در Gاست که با tiشروع و با siبایان می‌یابند، و P=Pi.

یک جریان (Flow) در شبکه، تشکیل شده از یک بردار f با بعد |P|، به گونه‌ای که برای هر سفر مانند (ti,si)و به ازای هر مسیر متناظر با این سفر مانند pPi, fpدرایه‌ای از fرا که متناظر با میزان جریان در مسیر pاست نشان می‌دهد. از طرفی هر جریان f، میزانی از جریان را روی یال دلخواه eاز Gالقا می‌کند که آن را با feنشان می‌دهیم. در این چارچوب، خواهیم داشت: fp=fe.

شبکه خودخواهانه

یک شبکهٔ خودخواهانه، یک ۳تایی (G,r,c)تلقی می‌شود که G، گراف در تناظر با شبکهٔ چند جریانهٔ N است. اگر تعداد سفرهای متناظر با N را k بگیریم، آنگاه r یک بردار با بعد k است که درایهٔ jام آن میزان ترافیک مورد نیاز برای سفر از راس ti به راس si در شبکه است. بنابراین جریان f را برای این شبکه مجاز گوییم، اگر به ازای تمام مسیرهای بین ti تا si، جمع جریانشان برابر با میزان مورد نیاز ri شود، یعنی: pPifp=ri .

از طرفی، هر یال از G دارای میزانی سربار است. مثلاً سربار می‌تواند میزان تأخیر عبور یک بستهٔ ترافیکی یا یک وسیلهٔ نقلیه از یال مورد نظر باشد. سربار یال e را با ce نشان می‌دهیم که در تناظر با بردار c است. برای این که قدرت مدل کردن ازدحام در شبکه را داشته باشیم، ce عموماً به صورت تابعی غیرنزولی از میزان جریان عبوری از یال مورد نظر تعریف می‌شود. برای مسیری از گراف که متناظر با یکی از سفرها باشد، یعنی برای pP، و نیز برای جریان f،cp(f) برابر میزان سربار در طول این مسیر، یعنی برابر epce(fe) تعریف می‌شود.

تعادل واردراپ

شکل معادلی از تعادل نش در مدل کردن شبکه‌های ترافیکی به صورت بازی، توسط جان گلن واردراپ (John Glen Wardrop) تعریف شده‌است، که به تعادل واردراپ (به انگلیسی: Wardrop Equilibrium[۴]) شهرت یافته‌است. مشابه با مفهوم کلیدی در تعریف تعادل نش، موسوم به اینکه بازیکنی انگیزه تخطی نداشته‌باشد، جریانی در شبکهٔ خودخواهانهٔ (G,r,c) تعادل واردراپ است، اگر به ازای هر 1ik، و به ازای هر دو مسیر p,p~Pi، به گونه‌ای که fp>0، داشته باشیم cpfcp~f. بنابراین، تمامی مسیرهایی از ti به si که جریان مثبت دارند، همگی الزاماً هزینه (سربار) یکسان دارند.

همان‌گونه که بیان شد، تعادل واردراپ، صورت‌بندی دیگری از مفهوم تعادل نش است، به همین دلیل به آن اصطلاح جریان نش (Nash flows) نیز اختصاص داده شده‌است. هری (Haurie) و مارکوت (Marcotte) صورت‌بندی دقیقی از تناظر دو مفهوم تعادل واردراپ و تعادل نش برای بازی‌های متناهی و فرم نرمال ارائه کردند.

شاید بتوان گفت پایه‌ای‌ترین قضیه در این باب، قضیه وجود تعادل واردراپ در شبکهٔ خودخواهانه دلخواه است. بکمن، مک گور و وینستن صورت‌بندی مناسبی از این قضیه ارائه کردند، به این صورت که اولاً به ازای هر شبکه خودخواهانهٔ دلخواه (G,r,c)، حداقل یک تعادل واردراپ داریم، ثانیاً اگر f,f~ دو تعادل واردراپ باشند، آنگاه به ازای هر یال دلخواه eخواهیم داشت: الگو:وسط‌چین.ce(fe)=ce(fe~)الگو:پایان وسط‌چین

بازی‌های پتانسیلی

راه حل اثبات این حقیقت از ایده‌ای بسیار کلیدی در حل مسایل جستجو در ریاضیات استفاده می‌کند، که به ایدهٔ وریشنال‌ (Variational) معروف است، به این صورت عمل می‌کند که برای بررسی وجود و یافتن جواب ایده‌آل یک مساله در فضای جستجو، تابعی به اعضای آن فضا نسبت می‌دهد، به گونه‌ای که جواب ایده‌آل میزان تابع را کمینه (یا بیشنیه) کند. به این ترتیب، تحلیل جواب ایده‌آل به یک مسالهٔ بهینه‌سازی تقلیل پیدا می‌کند. استفاده از این ایده در نظریهٔ بازی، منجر به تعریف مفهوم مهمی تحت عنوان بازی‌های پتانسیلی شده‌است. در این قشر از بازی‌ها، خروجی‌ها به گونه‌ای تعریف شده‌است که می‌توان تابع پتانسیل ϕ را تعریف کرد، به‌گونه‌ای که مقدار کمینهٔ آن در تعادل نش اتفاق بیفتد. در راه حلی که بکمن، مک گور و وینستن ارائه دادند، تابع پتاسیل به‌صورت مقابل تعریف شد: ϕ(f)=eE0fece(x)dx.

نکته‌ای که منجر به مناسب بودن تابع معرفی‌شده، به عنوان یک تابع پتانسیل می‌گردد، این حقیقت است که اگر f یک تعادل واردراپ و f* یک جریان دلخواه در شبکه باشد، رابطهٔ مقابل را داریم: pPcp(f)fppPcp(f)fp* ، که طبق cpfcp~f به راحتی نتیجه می‌شود. اما با در نظر گرفتن یک دوگانه شماری ساده، روابط زیر را خواهیم داشت:

الگو:وسط‌چین

.pPcp(f)fp=eEce(fe)fe، pPcp(f)fp*=eEce(fe)fe* الگو:پایان وسط‌چین

بنابراین نامساوی eEce(fe)feeEce(fe)fe*را داریم. در ادامه، طبق خاصیت انتگرال، به راحتی خواهیم داشت: ϕ(f)ϕ(f*). بنابراین همان‌گونه که انتظار داشتیم، تابع پتانسیل معرفی شده مقدار کمینه خود را در تعادل واردراپ اتخاذ می‌کند. اما دقت کنید که فضای همهٔ جریان‌ها یک مجموعه فشرده (Compact) است و می‌دانیم طبق قضیه مقدار بحرانی، طبق پیوستگی، ϕ حتماً میزان کمینهٔ خود را روی همهٔ جریان‌ها اتخاذ می‌کند، که مستقیماً وجود حداقل یک تعادل واردراپ را نتیجه می‌دهد.

بکمن، مک گور و وینستن علاوه بر اثبات وجود تعادل واردراپ، در مقالهٔ خود نشان دادند که اگر f,f~دو تعادل واردراپ باشند، آن‌گاه به ازای هر یال دلخواه eخواهیم داشت:

ce(fe)=ce(fe~)[۵]].

هزینهٔ هرج‌ومرج در شبکه‌های خودخواهانه

برای جریان f، هزینهٔ اجتماعی C(f) به‌طور طبیعی به صورت زیر تعریف می‌شود:

الگو:وسط‌چین .C(f)=pPcp(f)fp=eEce(fe)fe الگو:پایان وسط‌چین

تابع C(f)، پیوسته از دامنه‌ای فشرده است. پس طبق قضیه مقدار بحرانی مقدار مینیمم خود را اتخاذ خواهد کرد. فرض کنید که این مینیمم در جریان f*اتخاذ گردد. fرا نیز تعادل واردراپ بگیرید. توجه کنید که می‌دانستیم برای تمامی تعادل‌های واردراپ، میزان C(f) یکسان خواهد بود.

هزینهٔ هرج‌ومرج ρ(G,r,c) در این شبکه به صورت مقابل تعریف می‌شود: ρ(G,r,c)=C(f)C(f*). همچنین اگر I گردایه‌ای از شبکه‌های خودخواهانه باشد، به طریق مشابه هزینهٔ هرج‌ومرج ρ(I)به صورت بیشینهٔ هزینهٔ هرج‌ومرج بین اعضای Iتعریف می‌شود: ρ(I)=sup(G,r,c)Iρ(G,r,c).

یکی از اساسی‌ترین هدف‌ها که تیوریسین‌های نظریهٔ بازی در مقولهٔ شبکه‌های خودخواهانه دنبال می‌کنند، دادن کران‌هایی تئوری برای هزینهٔ هرج‌ومرج، برحسب خانواده‌های متفاوت از توابع سربار روی یال‌ها است. به‌طور کلی، عامل‌ها در شبکه‌های خودخواهانه مسیری را انتخاب می‌کنند که به‌طور خودخواهانه سربار سفرشان را کمینه کند، که در نتیجهٔ آن رفتار جمعیتی آن‌ها در نقطهٔ تعادل واردراپ رخ می‌دهد. نکته اینجاست که تعادل واردراپ در جریانی رخ می‌داد که تابع پتانسیل را کمینه کند، در حالیکه دلخواه مدیر شبکه این است که سود اجتماعی بیشینه شود، یا به عبارتی دیگر هزینهٔ اجتماعی (C(f)) کمینه شود، که فاصلهٔ آن‌ها همان هزینهٔ هرج‌ومرج است. بنابراین که هر قدر که تابع پتانسیل شبکه ϕ به تابع هزینهٔ اجتماعی C به اصطلاح "شبیه‌تر" باشد، احتمالاً هزینهٔ هرج‌ومرج کمتری خواهیم داشت. در ادامه تلاش‌هایی را، که برای دادن کران‌های اطمینان در مورد هزینهٔ هرج‌ومرج در این گونه شبکه‌ها شده‌است، بررسی می‌کنیم.

کران پیگو[۶]

معمولاً برای تابع سربار یال‌ها، یک خانواده پارامتری ζ در نظر می‌گیرند، که توابع سربار یال‌ها از آن انتخاب می‌شوند، سپس برای این خانواده پارامتری خاص، کران هزینهٔ هرج‌ومرج معرفی می‌کنند. کران پیگو برای خانواده ζ به صورت زیر تعریف می‌شود:

الگو:وسط‌چین .α(ζ)=supcζsupx,r0r.c(r)x.c(x)+(rx)c(r) الگو:پایان وسط‌چین

با اینکه ممکن است عبارت کران پیگو سخت به نظر برسد، اما این در حالی است که برای خانواده‌های خاص از توابع سربار، پیگو باند مقدار قابل محاسبه‌ای خواهد داشت. مثلاً اگر ζ خانواده توابع خطی با ضرایب نامنفی باشد، خواهیم داشت: α(ζ)=43. این کران حتی زمانی که ζ خانواده توابع مقعر باشد هم برقرار است[۷].

همچنین اگر ζ خانوادهٔ چند جمله‌ای‌های با ضرایب نامنفی و درجه حداکثر p باشد، آن‌گاه:

α(ζ)=[1p.(p+1)p+1p]1 [۸].

برای اثبات درستی کران پیگو، فرض کنید cζ یک تابع هزینه باشد. طبق تعریف ضریب پیگو، برای هر x,r>0 خواهیم داشت: الگو:وسط‌چین.x.c(x)r.c(x)α(ζ)+(xr)c(r)الگو:پایان وسط‌چین اگر قرار دهید x=f*,r=fe خواهیم داشت: الگو:وسط‌چین C(f*)=eEce(f*)f*1α(ζ)eEce(fe)fe+eE(fe*fe)ce(fe)C(f)α(ζ)الگو:پایان وسط‌چین

که نامساوی آخر در بخش بازی‌های پتانسیلی ثابت شد. بنابراین: C(f)C(f*)α(ζ). یعنی هزینهٔ اجتماعی تعادل واردراپ، حداکثر به اندازهٔ ضریب پیگو نسبت به هزینهٔ اجتماعی بهینه، افزایش پیدا کرده‌است: ρ(G,r,c)α(ζ).

پارادکس براوس

یک شبکهٔ خودخواهانه را در نظر بگیرید. به نظر می‌رسد که اضافه کردن یک یال بین دو راس، امکان جابه جایی ترافیک را در مسیرهای مختلف ارتقا دهد. به نحوی منطقی به نظر می‌رسد که با اضافه شدن این یال، سربار جابه جایی ترافیک در شبکه اگر کم نشود، زیاد هم نشود و بنابراین هزینهٔ هرج‌ومرج نیز زیاد نشود. اما این درست نیست. در حقیقت شبکه‌های بسیاری هستند که با اضافه کردن یال‌های به خصوصی در آن‌ها، نه تنها هزینهٔ هرج‌ومرج کاهش نمی‌یابد، بلکه افزایش پیدا می‌کند. این رخ داد به پارادوکس براوس (به انگلیسی: Braess' Paradox) معروف است.

مثلاً شکل مقابل، ۲ مسیر از Start به End نشان می‌دهد که زمان طی خیابان Start تا A و همچنین خیابان B تا End، برابر تعداد رانندگان تقسیم بر ۱۰۰ دقیقه است و زمان طی خیابان A تا End و همچنین خیابان Start تا B، مستقل از تعداد رانندگانی که این مسیر را انتخاب می‌کنند، برابر ۴۵ دقیقه است. فرض کنیم ۴۰۰۰ راننده می‌خواهند از Start به End بروند و در ابتدا، مسیری میان A و B وجود ندارد.

اگر یکی از مسیرهای StartAEnd یا StartBEnd کوتاه‌تر از مسیر دیگر باشد، به صورت خالص، همهٔ رانندگان مسیر کوتاه‌تر را انتخاب می‌کردند. اما در این مثال این دو مسیر هم‌اندازه و در نتیجه تعادل نش ترکیبی دارد. با فرض اینکه A راننده از مسیر بالا می‌روند، زمانی که طول می‌کشد به مقصد برسند برابر A100+45 دقیقه است و با فرض اینکه B راننده از مسیر پایین می‌روند، زمان رسیدن آن‌ها به مقصد نیز 45+B100 است. با توجه به اینکه ۴۰۰۰ راننده وجود دارد و A+B=4000، A=B=2000 باشد، یک تعادل برای این بازی است و زمان رسیدن تمام رانندگان، برابر 2000100+45=65 دقیقه خواهد شد. اگر در این بازی، Cost را مجموع زمانی که رانندگان در مسیر هستند در نظر بگیریم، می‌بینیم که PoA برابر ۱ است، زیرا تعادل نش همان استراتژی پروفایلی است که در آن تابع هزینه کمترین مقدار می‌شود.

حال به هدف افزایش بازدهی، فرض کنیم خیابان AB را ایجاد کنیم که زمان طی آن برابر ۰ دقیقه باشد. در این صورت فرض کنیم در حالت تعادل قبلی که A=B=2000 بود، راننده‌ای مسیر StartABEnd را انتخاب کند. در این صورت زمان رسیدن او به مقصد برابر 2000100+0+2001100=40.01 دقیقه خواهد شد که نسبت به ۶۵ دقیقه، ۲۵ دقیقه بهتر است. پس با این وجود، به‌زودی تمام ۴۰۰۰ راننده این مسیر را انتخاب می‌کنند و هرچه رانندگان بیشتری این مسیر را انتخاب کنند، زمان بیشتری طول می‌کشد که به مقصد برسند. وقتی تعداد افرادی که از StartABEnd می‌روند به ۲۵۰۰ برسد (۱۵۰۰ نفر هنوز در مسیر StartBEnd باقی بمانند)، زمانی که طول می‌کشد هر یک از این ۲۵۰۰ نفر به مقصد برسند برابر 2500100+0+4000100=65 دقیقه خواهد بود که در تعادل ابتدایی نیز همین مقدار بود. اما برای ۱۵۰۰ نفر موجود در مسیر StartBEnd، این زمان به 45+4000100=85 دقیقه می‌رسد که ۲۰ دقیقه بیشتر از این زمان در تعادل اول است. پس به ناچار این ۱۵۰۰ راننده هم باید مسیر خود را به StartABEnd عوض کنند که زودتر برسند. زمانی که تمام راننگان این مسیر را انتخاب کنند، زمان رسیدن هر راننده از Start به End برابر 4000100+0+4000100=80 دقیقه خواهد شد و در تعادل خواهد بود (زیرا اگر راننده‌ای مسیر خود را به StartBEnd تغییر دهد، زمان رسیدنش به مقصد 45+4000100=85 دقیقه خواهد شد که بدتر است، پس مسیر خود را عوض نمی‌کند). در این مثال دیدیم که با اضافه کردن یک خیابان، استراتژی پروفایل تعادل نش عوض شد اما بازدهی مثلاً در حالتی که هیچ راننده‌ای از خیابان AB عبور نکند و نصف-نصف از بالا و پایین عبور کنند بیشتر است. پس PoA مقداری بزرگ‌تر از یک می‌گیرد. در نتیببجه در این مثال، اضافه کردن یک خیابان کوتاه به هدف کم کردن ترافیک و افزایش بازدهی، نتیجهٔ عکس می‌دهد.

نمونه‌هایی از پارادوکس براوس

مثال‌هایی از این پارادوکس براوس در شهرهای مختلف دیده‌شده‌است. مثلاً در شهر سئول در کرهٔ جنوبی، با برداشتن یکی از اتوبان‌ها به عنوان بخشی از پروژهٔ بهبودسازی چئونگ چئون، ترافیک در سراسر شهر روان‌تر و بهتر شد. مثال دیگر شهر اشتوگارت واقع در کشور آلمان است که بعد از سرمایه‌گذاری در شبکهٔ راهی شهر در سال ۱۹۶۹، ترافیک بهبود نیافت؛ اما با بسته شدن بعضی خیابان‌های تازه ساخته‌شده، ترافیک بهبود یافت.[۹]

حتی این پارادوکس در استراتژی تیم‌های ورزشی دیده می‌شود. مثلاً در بسکتبال، تیم را می‌توان به عنوان یک شبکهٔ راه برای انداختن توپ در سبد دید که هر استراتژی استفاده شده در تیم، یک بازده متناظر خود دارد. همچنین در این مدل بهترین بازیکن به‌عنوان راه میانبر است که به دلیل استفادهٔ بیش از اندازه از او، باعث کاهش بازدهی تیم می‌شود. راه پیشنهاد شده برای حداکثر بازدهی می‌تواند این باشد که بهترین بازیکن نیز حدوداً اندازهٔ بازیکنان دیگر توپ را شوت کند.[۱۰]

روش‌های مهار هزینهٔ هرج‌ومرج [۱۱]

مثال‌های ساده‌ای وجود دارد که در آن‌ها هزینهٔ هرج‌ومرج می‌تواند به شدت زیاد شود. به‌طور کلی پارادوکس براوس به خصوص در شبکه‌های بزرگ می‌تواند خطرناک شود [۱۲]، و هزینهٔ هرج‌ومرج را به شدت افزایش دهد. بنابراین از دید فنی نمی‌توان برای شبکهٔ دلخواه، کران بالای کلی‌ای در مورد هزینهٔ هرج‌ومرج آن داد. در واقع مثال‌های نقض نسبتاً ساده‌ای در شبکه‌های خودخواهانه با یک سفر می‌توان ساخت، که در آن‌ها هزینهٔ هرج‌ومرج به بی‌نهایت میل کند. راه حل کلی‌ای که برای کران‌دار کردن هزینهٔ هرج‌ومرج وجود دارد، اضافه کردن محدودیت‌های جدید به مساله است. این محدودیت‌ها می‌تواند در دو بعد الگوریتمی، و یا محدود کردن توابع سربار یال‌ها به خانواده‌های مشخص صورت پذیرد. برای نمونه می‌توان شبکه را به گونه‌ای دست کاری کرد، یعنی برخی از یال‌ها را حذف و در صورت امکان، برخی از یال‌ها را اضافه کنیم، به گونه‌ای که هزینهٔ هرج‌ومرج کاهش پیدا کند. امروزه، این راه حل به‌طور ویژه در مورد مدیریت ترافیک شهری مورد استفاده است.

راه حل دیگری که برای کنترل هزینهٔ هرج‌ومرج استفاده می‌شود، این است که بخشی از ترافیک به صورت مرکزی مدیریت شود، سپس عامل‌های خودخواه متعاقباً نسبت به ازدحام موجود در شبکه، مسیر خودخواهانهٔ خود را انتخاب کنند. کاراکوستاس (Karakostas) نشان داد که پیش گرفتن چنین استراتژی‌هایی می‌تواند به طرز چشم‌گیری ضریب هرج‌ومرج را در شبکه کاهش دهد. [۱۳]

قیمت‌گذاری روی یال‌ها، استراتژی دیگری است که در این باب می‌تواند پیش گرفته شود، به نحوی که هزینهٔ یک مسیر، برای هر یک از عوامل تغییر کند، و در نتیجهٔ آن، برخی از آن‌ها مسیر خود را تغییر دهند. اگر قیمت‌گذاری هوشمندانه باشد، این تغییر مسیرها می‌تواند و جهت سود اجتماعی ایجاد شود، که در نتیجهٔ آن هزینهٔ هرج‌ومرج کاهش یابد.

ریچارد کول (Richard Cole)، یوگنی دودیس (Yevgeniy Dodis) و تیم رافگاردن (Tim Roughgarden) در مقاله‌ای کارا بودن روش قیمت‌گذاری را در این راستا نشان دادند.[۱۴]

منابع

الگو:پانویس