مدل بردلی-تری

از testwiki
نسخهٔ تاریخ ۲ ژوئن ۲۰۲۴، ساعت ۰۲:۳۷ توسط imported>InternetArchiveBot (Add 3 books for ویکی‌پدیا:تأییدپذیری (20240601sim)) #IABot (v2.0.9.5) (GreenC bot)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

مدل برادلی-تری یک مدل احتمال برای نتیجه مقایسه‌های دوتایی بین آیتم‌ها، تیم‌ها یا اشیا است. با توجه به یک جفت آیتم الگو:Mvar و الگو:Mvar که از یک توزیع خاص گرفته شده است، این احتمال را تخمین می‌زند که مقایسه زوجی الگو:ریاضی درست باشد، این فرض به احتمال زیر صحیح است:الگو:NumBlkبطوریکه الگو:Mvar یک امتیاز عدد حقیقی مثبت است که به هر یک از الگو:Mvarها اختصاص داده شده است. مقایسه الگو:ریاضی می‌توان به صورت " الگو:Mvar به الگو:Mvar ترجیح داده شده"، "رتبه الگو:Mvar بالاتر از الگو:Mvar است"، یا " الگو:Mvar ,الگو:Mvar را می‌زند " بسته به کاربرد، خواند و با استفاده از "قضاوت" امکان ارزیابی ذهنی را فراهم می‌کند.

به عنوان مثال، الگو:Mvar ممکن است نشان دهنده مهارت یک تیم در یک تورنمنت ورزشی باشد و P(i>j) به این معنای احتمال برد الگو:Mvar در بازی مقابل الگو:Mvar است.[۱] یا الگو:Mvar ممکن است نشان دهنده کیفیت یا مطلوبیت یک محصول تجاری باشد و P(i>j) احتمال این است که مصرف‌کننده محصول الگو:Mvar را بر محصول الگو:Mvar ترجیح می‌دهد.

مدل بردلی-تری می‌تواند در جهت رو به جلو برای پیش‌بینی نتایج، همان‌طور که توضیح داده شد، استفاده شود، اما معمولاً به صورت معکوس برای استنتاج امتیازات الگو:Mvar با توجه به مجموعه‌ای از نتایج مشاهده شده استفاده می‌شود. در این نوع کاربرد الگو:Mvar نشان دهنده مقداری از قدرت یا کیفیت i است و این مدل به ما امکان می‌دهد نقاط قوت را از یک سری مقایسه‌های زوجی تخمین بزنیم. به عنوان مثال، در بررسی ترجیحات شراب، ممکن است برای پاسخ دهندگان دشوار باشد که رتبه‌بندی کاملی از مجموعه بزرگی از شراب‌ها را ارائه دهند، اما برای آنها نسبتاً آسان است که جفت‌های نمونه شراب را با هم مقایسه کنند و بگویند که کدام یک از شراب‌ها بهتر است. بر اساس مجموعه‌ای از این مقایسه‌های زوجی، می‌توان از مدل بردلی-تری برای به دست آوردن رتبه‌بندی کامل شراب‌ها استفاده کرد.

هنگامی که مقادیر امتیاز الگو:Mvar محاسبه شد، می‌توان از مدل در جهت رو به جلو نیز استفاده کرد، به عنوان مثال برای پیش‌بینی نتیجه احتمالی مقایسه‌هایی که هنوز واقعاً رخ نداده‌اند. به عنوان مثال، در مثال بررسی شراب، می‌توان احتمال ترجیح شراب i بر شراب j را محاسبه کرد، حتی اگر هیچ‌کس در نظرسنجی مستقیماً آن جفت خاص را مقایسه نکرده باشد.

تاریخچه و کاربردها

این مدل به افتخار رالف آ. بردلی و میلتون ای. تری،[۲] که آن را در سال ۱۹۵۲ ارائه کردند، نامگذاری شده است،[۳] اگرچه قبلاً توسط ارنست زرملو در دهه ۱۹۲۰ مورد مطالعه قرار گرفته بود.[۱][۴][۵] کاربردهای این مدل شامل رتبه‌بندی رقبا در مسابقات ورزشی، شطرنج و سایر مسابقات،[۶] رتبه‌بندی محصولات در نظرسنجی‌های مقایسه زوجی انتخاب مصرف‌کننده، تجزیه و تحلیل سلسله مراتب سلطه در جوامع حیوانی و انسانی،[۷] رتبه‌بندی مجلات، رتبه‌بندی مدل‌های هوش مصنوعی،[۸] و برآورد ارتباط اسناد در موتورهای جستجوی ماشینی و غیره است.

تعریف

مدل بردلی-تری را می‌توان به روش‌های مختلفی پارامتری کرد. معادله (الگو:EquationNote) شاید رایج‌ترین روش باشد، اما تعدادی دیگر نیز وجود دارد. بردلی و تری خود توابع امتیاز نمایی، pi=eβi ، را تعریف کرده‌اند به طوری که

P(i>j)=eβieβi+eβj.

به‌طور معادل می‌توان از یک logit استفاده کرد، به طوری که[۱]

logitP(i>j)=logP(i>j)1P(i>j)=logP(i>j)P(j>i)=βiβj,

یعنی logitp=logp1p برای 0<p<1.

این فرمول شباهت بین مدل بردلی-تری و رگرسیون لجستیک را برجسته می‌کند. هر دو اساساً از یک مدل واحد، اما به روش‌های مختلف استفاده می‌کنند. در رگرسیون لجستیک فرد معمولاً پارامترهای βi را می‌داند و تلاش می‌کند تا شکل عملکردی P(i>j) را استنباط کند؛ در رتبه‌بندی تحت مدل بردلی-تری، فرد شکل عملکردی را می‌شناسد و سعی می‌کند پارامترها را استنتاج کند.

تخمین پارامترها

رایج‌ترین کاربرد مدل برادلی-تری، استنتاج مقادیر پارامترهای pi با توجه به مجموعه ای از نتایج مشاهده شده i>j است مانند برد و باخت در یک مسابقه. ساده‌ترین راه برای تخمین پارامترها ، تخمین حداکثر درستنمایی است، یعنی با به حداکثر رساندن احتمال نتایج مشاهده شده با توجه به مقادیر مدل و پارامتر.

فرض کنید نتایج مجموعه ای از رقابت‌های دوتایی بین گروه خاصی از افراد را می‌دانیم و اجازه دهید الگو:Mvar تعداد دفعاتی باشد که الگو:Mvar فردی الگو:Mvar را شکست می‌دهد. سپس احتمال این مجموعه از نتایج در مدل بردلی-تریij[P(i>j)]wij است و درستنمایی پارامتر الگو:ریاضی برابر است با[۱]

L(𝐩)=lnij[P(i>j)]wij=i=1nj=1nln(pipi+pj)wij=ijwijlnpipi+pj=ij[wijlnpiwijln(pi+pj)].

Zermelo[۴] نشان داد که این عبارت تنها دارای یک ماکزیمم واحد است که با اگر نسبت به pi مشتق گرفته و نتیجه را مساوی صفر قرار دهیم خواهیم داشت:الگو:NumBlkاین معادله هیچ راه حل بسته شناخته شده‌ای ندارد، اما زرملو حل آن را با تکرار ساده پیشنهاد کرد. با شروع از هر مجموعه مناسبی از مقادیر اولیه (مثبت) برای pi ، یکی به‌طور مکرر به روز رسانی را انجام می‌دهدالگو:NumBlkبرای همه الگو:Mvar‌ها به نوبت این مقادیر محاسبه می‌شود. پارامترهای به دست آمده تا یک ضریب ثابت، دلخواه هستند، بنابراین پس از محاسبه همه مقادیر جدید باید با تقسیم بر میانگین هندسی آنها نرمال سازی شوند:الگو:NumBlkاین فرایند تخمین، احتمال ورود به سیستم را در هر تکرار بهبود می‌بخشد و تضمین می‌شود که در نهایت به حداکثر منحصر به فرد برسد.[۴][۹] با این حال، همگرایی کند است.[۱][۱۰] اخیراً اشاره شده است[۱۱] که معادله (الگو:EquationNote) را نیز می‌توان به صورت بازآرایی کرد.

pi=jwijpj/(pi+pj)jwji/(pi+pj),

که با تکرار قابل حل استالگو:NumBlkپس از هر دور به روز رسانی با استفاده از معادله (الگو:EquationNote) دوباره عادی می‌شود. این تکرار نتایج یکسانی را با خروجی معادله (الگو:EquationNote) می‌دهد، اما خیلی سریعتر همگرا می‌شود و از این رو معمولاً بر (الگو:EquationNote) ترجیح داده می‌شود.[۱۱]

نمونه کار شده از روش حل

یک رقابت ورزشی بین چهار تیم را در نظر بگیرید که در مجموع ۲۲ بازی را بین خود انجام می‌دهند. بردهای هر تیم در ردیف‌های جدول زیر و حریفان به صورت ستون آورده شده‌اند:

نتایج
آ ب سی D
آ ۲ ۰ ۱
ب ۳ ۵ ۰
سی ۰ ۳ ۱
D ۴ ۰ ۳

به عنوان مثال، تیم A دو بار تیم B را شکست داده و سه بار به تیم B باخته است و با تیم C اصلاً بازی نکرده است. یک برد و چهار باخت مقابل تیم D دارد.

ما می‌خواهیم نقاط قوت نسبی تیم‌ها را تخمین بزنیم که این کار را با محاسبه پارامترهای pi انجام می‌دهیم، بطوریکه پارامترهای بالاتر نشان دهنده مهارت بیشتر است. برای انجام این کار، چهار ورودی را در بردار پارامتر الگو:ریاضی به‌طور دلخواه مقداردهی می‌کنیم، به عنوان مثال مقدار ۱ را به هر تیم اختصاص می‌دهیم: الگو:ریاضی. سپس معادله (الگو:EquationNote) را برای به روز رسانی p1 اعمال می‌کنیم، که نتیجه زیر حاصل می‌شود:p1=j(1)w1jpj/(p1+pj)j(1)wj1/(p1+pj)=211+1+011+1+111+1311+1+011+1+411+1=0.429.اکنون (الگو:EquationNote) را دوباره برای به روز رسانی p2 اعمال می‌کنیم، مطمئن شوید که از مقدار جدید p1 که محاسبه شد استفاده می‌کنید:p2=j(2)w2jpj/(p2+pj)j(2)wj2/(p2+pj)=30.4291+0.429+511+1+011+1211+0.429+311+1+011+1=1.172به‌طور مشابه برای p3 و p4 داریم:p3=j(3)w3jpj/(p3+pj)j(3)wj3/(p3+pj)=00.4291+0.429+31.1721+1.172+111+1011+0.429+511+1.172+311+1=0.557p4=j(4)w4jpj/(p4+pj)j(4)wj4/(p4+pj)=40.4291+0.429+01.1721+1.172+30.5571+0.557111+0.429+011+1.172+111+0.557=1.694سپس تمام پارامترها را با تقسیم بر میانگین هندسی آنها نرمال می‌کنیم (0.429×1.172×0.557×1.694)1/4=0.830 برای بدست آوردن پارامترهای تخمینی الگو:ریاضی.

برای بهبود بیشتر تخمین‌ها، با استفاده از مقادیر الگو:ریاضی جدید، فرایند را تکرار می‌کنیم؛ مثلاً،p1=21.4130.516+1.413+00.6720.516+0.672+12.0410.516+2.041310.516+1.413+010.516+0.672+410.516+2.041=0.725.با تکرار این فرایند برای پارامترهای باقیمانده و عادی سازی، الگو:ریاضی را دریافت می‌کنیم. تکرار ۱۰ بار دیگر همگرایی سریع به سمت حل نهایی الگو:ریاضی می‌دهد. این نشان می‌دهد که تیم D قوی‌ترین و تیم B دومین قوی‌تر است، در حالی که تیم‌های A و C تقریباً از نظر قدرت برابر هستند اما کمتر از تیم‌های B و D هستند. حتی اگر همه تیم‌ها با هم بازی نکرده باشند.

جستارهای وابسته

منابع

الگو:پانویس

  1. ۱٫۰ ۱٫۱ ۱٫۲ ۱٫۳ ۱٫۴ الگو:Cite journal خطای یادکرد: برچسب <ref> نامعتبر؛ نام «hunter» چندین بار با محتوای متفاوت تعریف شده است
  2. الگو:Cite encyclopedia
  3. الگو:Cite journal
  4. ۴٫۰ ۴٫۱ ۴٫۲ الگو:Cite journal خطای یادکرد: برچسب <ref> نامعتبر؛ نام «zermelo» چندین بار با محتوای متفاوت تعریف شده است
  5. الگو:Citation
  6. الگو:Cite journal
  7. الگو:Cite journal
  8. الگو:Cite web
  9. الگو:Cite journal
  10. الگو:Cite journal
  11. ۱۱٫۰ ۱۱٫۱ الگو:Cite journal خطای یادکرد: برچسب <ref> نامعتبر؛ نام «newman» چندین بار با محتوای متفاوت تعریف شده است