مدل بردلی-تری
مدل برادلی-تری یک مدل احتمال برای نتیجه مقایسههای دوتایی بین آیتمها، تیمها یا اشیا است. با توجه به یک جفت آیتم الگو:Mvar و الگو:Mvar که از یک توزیع خاص گرفته شده است، این احتمال را تخمین میزند که مقایسه زوجی الگو:ریاضی درست باشد، این فرض به احتمال زیر صحیح است:الگو:NumBlkبطوریکه الگو:Mvar یک امتیاز عدد حقیقی مثبت است که به هر یک از الگو:Mvarها اختصاص داده شده است. مقایسه الگو:ریاضی میتوان به صورت " الگو:Mvar به الگو:Mvar ترجیح داده شده"، "رتبه الگو:Mvar بالاتر از الگو:Mvar است"، یا " الگو:Mvar ,الگو:Mvar را میزند " بسته به کاربرد، خواند و با استفاده از "قضاوت" امکان ارزیابی ذهنی را فراهم میکند.
به عنوان مثال، الگو:Mvar ممکن است نشان دهنده مهارت یک تیم در یک تورنمنت ورزشی باشد و به این معنای احتمال برد الگو:Mvar در بازی مقابل الگو:Mvar است.[۱] یا الگو:Mvar ممکن است نشان دهنده کیفیت یا مطلوبیت یک محصول تجاری باشد و احتمال این است که مصرفکننده محصول الگو:Mvar را بر محصول الگو:Mvar ترجیح میدهد.
مدل بردلی-تری میتواند در جهت رو به جلو برای پیشبینی نتایج، همانطور که توضیح داده شد، استفاده شود، اما معمولاً به صورت معکوس برای استنتاج امتیازات الگو:Mvar با توجه به مجموعهای از نتایج مشاهده شده استفاده میشود. در این نوع کاربرد الگو:Mvar نشان دهنده مقداری از قدرت یا کیفیت است و این مدل به ما امکان میدهد نقاط قوت را از یک سری مقایسههای زوجی تخمین بزنیم. به عنوان مثال، در بررسی ترجیحات شراب، ممکن است برای پاسخ دهندگان دشوار باشد که رتبهبندی کاملی از مجموعه بزرگی از شرابها را ارائه دهند، اما برای آنها نسبتاً آسان است که جفتهای نمونه شراب را با هم مقایسه کنند و بگویند که کدام یک از شرابها بهتر است. بر اساس مجموعهای از این مقایسههای زوجی، میتوان از مدل بردلی-تری برای به دست آوردن رتبهبندی کامل شرابها استفاده کرد.
هنگامی که مقادیر امتیاز الگو:Mvar محاسبه شد، میتوان از مدل در جهت رو به جلو نیز استفاده کرد، به عنوان مثال برای پیشبینی نتیجه احتمالی مقایسههایی که هنوز واقعاً رخ ندادهاند. به عنوان مثال، در مثال بررسی شراب، میتوان احتمال ترجیح شراب بر شراب را محاسبه کرد، حتی اگر هیچکس در نظرسنجی مستقیماً آن جفت خاص را مقایسه نکرده باشد.
تاریخچه و کاربردها
این مدل به افتخار رالف آ. بردلی و میلتون ای. تری،[۲] که آن را در سال ۱۹۵۲ ارائه کردند، نامگذاری شده است،[۳] اگرچه قبلاً توسط ارنست زرملو در دهه ۱۹۲۰ مورد مطالعه قرار گرفته بود.[۱][۴][۵] کاربردهای این مدل شامل رتبهبندی رقبا در مسابقات ورزشی، شطرنج و سایر مسابقات،[۶] رتبهبندی محصولات در نظرسنجیهای مقایسه زوجی انتخاب مصرفکننده، تجزیه و تحلیل سلسله مراتب سلطه در جوامع حیوانی و انسانی،[۷] رتبهبندی مجلات، رتبهبندی مدلهای هوش مصنوعی،[۸] و برآورد ارتباط اسناد در موتورهای جستجوی ماشینی و غیره است.
تعریف
مدل بردلی-تری را میتوان به روشهای مختلفی پارامتری کرد. معادله (الگو:EquationNote) شاید رایجترین روش باشد، اما تعدادی دیگر نیز وجود دارد. بردلی و تری خود توابع امتیاز نمایی، ، را تعریف کردهاند به طوری که
بهطور معادل میتوان از یک logit استفاده کرد، به طوری که[۱]
یعنی برای
این فرمول شباهت بین مدل بردلی-تری و رگرسیون لجستیک را برجسته میکند. هر دو اساساً از یک مدل واحد، اما به روشهای مختلف استفاده میکنند. در رگرسیون لجستیک فرد معمولاً پارامترهای را میداند و تلاش میکند تا شکل عملکردی را استنباط کند؛ در رتبهبندی تحت مدل بردلی-تری، فرد شکل عملکردی را میشناسد و سعی میکند پارامترها را استنتاج کند.
تخمین پارامترها
رایجترین کاربرد مدل برادلی-تری، استنتاج مقادیر پارامترهای با توجه به مجموعه ای از نتایج مشاهده شده است مانند برد و باخت در یک مسابقه. سادهترین راه برای تخمین پارامترها ، تخمین حداکثر درستنمایی است، یعنی با به حداکثر رساندن احتمال نتایج مشاهده شده با توجه به مقادیر مدل و پارامتر.
فرض کنید نتایج مجموعه ای از رقابتهای دوتایی بین گروه خاصی از افراد را میدانیم و اجازه دهید الگو:Mvar تعداد دفعاتی باشد که الگو:Mvar فردی الگو:Mvar را شکست میدهد. سپس احتمال این مجموعه از نتایج در مدل بردلی-تری است و درستنمایی پارامتر الگو:ریاضی برابر است با[۱]
Zermelo[۴] نشان داد که این عبارت تنها دارای یک ماکزیمم واحد است که با اگر نسبت به مشتق گرفته و نتیجه را مساوی صفر قرار دهیم خواهیم داشت:الگو:NumBlkاین معادله هیچ راه حل بسته شناخته شدهای ندارد، اما زرملو حل آن را با تکرار ساده پیشنهاد کرد. با شروع از هر مجموعه مناسبی از مقادیر اولیه (مثبت) برای ، یکی بهطور مکرر به روز رسانی را انجام میدهدالگو:NumBlkبرای همه الگو:Mvarها به نوبت این مقادیر محاسبه میشود. پارامترهای به دست آمده تا یک ضریب ثابت، دلخواه هستند، بنابراین پس از محاسبه همه مقادیر جدید باید با تقسیم بر میانگین هندسی آنها نرمال سازی شوند:الگو:NumBlkاین فرایند تخمین، احتمال ورود به سیستم را در هر تکرار بهبود میبخشد و تضمین میشود که در نهایت به حداکثر منحصر به فرد برسد.[۴][۹] با این حال، همگرایی کند است.[۱][۱۰] اخیراً اشاره شده است[۱۱] که معادله (الگو:EquationNote) را نیز میتوان به صورت بازآرایی کرد.
که با تکرار قابل حل استالگو:NumBlkپس از هر دور به روز رسانی با استفاده از معادله (الگو:EquationNote) دوباره عادی میشود. این تکرار نتایج یکسانی را با خروجی معادله (الگو:EquationNote) میدهد، اما خیلی سریعتر همگرا میشود و از این رو معمولاً بر (الگو:EquationNote) ترجیح داده میشود.[۱۱]
نمونه کار شده از روش حل
یک رقابت ورزشی بین چهار تیم را در نظر بگیرید که در مجموع ۲۲ بازی را بین خود انجام میدهند. بردهای هر تیم در ردیفهای جدول زیر و حریفان به صورت ستون آورده شدهاند:
| آ | ب | سی | D | |
|---|---|---|---|---|
| آ | – | ۲ | ۰ | ۱ |
| ب | ۳ | – | ۵ | ۰ |
| سی | ۰ | ۳ | – | ۱ |
| D | ۴ | ۰ | ۳ | – |
به عنوان مثال، تیم A دو بار تیم B را شکست داده و سه بار به تیم B باخته است و با تیم C اصلاً بازی نکرده است. یک برد و چهار باخت مقابل تیم D دارد.
ما میخواهیم نقاط قوت نسبی تیمها را تخمین بزنیم که این کار را با محاسبه پارامترهای انجام میدهیم، بطوریکه پارامترهای بالاتر نشان دهنده مهارت بیشتر است. برای انجام این کار، چهار ورودی را در بردار پارامتر الگو:ریاضی بهطور دلخواه مقداردهی میکنیم، به عنوان مثال مقدار ۱ را به هر تیم اختصاص میدهیم: الگو:ریاضی. سپس معادله (الگو:EquationNote) را برای به روز رسانی اعمال میکنیم، که نتیجه زیر حاصل میشود:اکنون (الگو:EquationNote) را دوباره برای به روز رسانی اعمال میکنیم، مطمئن شوید که از مقدار جدید که محاسبه شد استفاده میکنید:بهطور مشابه برای و داریم:سپس تمام پارامترها را با تقسیم بر میانگین هندسی آنها نرمال میکنیم برای بدست آوردن پارامترهای تخمینی الگو:ریاضی.
برای بهبود بیشتر تخمینها، با استفاده از مقادیر الگو:ریاضی جدید، فرایند را تکرار میکنیم؛ مثلاً،با تکرار این فرایند برای پارامترهای باقیمانده و عادی سازی، الگو:ریاضی را دریافت میکنیم. تکرار ۱۰ بار دیگر همگرایی سریع به سمت حل نهایی الگو:ریاضی میدهد. این نشان میدهد که تیم D قویترین و تیم B دومین قویتر است، در حالی که تیمهای A و C تقریباً از نظر قدرت برابر هستند اما کمتر از تیمهای B و D هستند. حتی اگر همه تیمها با هم بازی نکرده باشند.
جستارهای وابسته
- رگرسیون ترتیبی
- مدل راش
- مقیاس (علوم اجتماعی)
- سیستم رتبهبندی الو
- مدل تورستونی
منابع
- ↑ ۱٫۰ ۱٫۱ ۱٫۲ ۱٫۳ ۱٫۴ الگو:Cite journal خطای یادکرد: برچسب
<ref>نامعتبر؛ نام «hunter» چندین بار با محتوای متفاوت تعریف شده است - ↑ الگو:Cite encyclopedia
- ↑ الگو:Cite journal
- ↑ ۴٫۰ ۴٫۱ ۴٫۲ الگو:Cite journal خطای یادکرد: برچسب
<ref>نامعتبر؛ نام «zermelo» چندین بار با محتوای متفاوت تعریف شده است - ↑ الگو:Citation
- ↑ الگو:Cite journal
- ↑ الگو:Cite journal
- ↑ الگو:Cite web
- ↑ الگو:Cite journal
- ↑ الگو:Cite journal
- ↑ ۱۱٫۰ ۱۱٫۱ الگو:Cite journal خطای یادکرد: برچسب
<ref>نامعتبر؛ نام «newman» چندین بار با محتوای متفاوت تعریف شده است