امتیاز اف ۱

در تجزیه و تحلیل طبقهبندهای آماری، امتیاز اف الگو:به انگلیسی معیاری برای ارزیابی دقت یک مدل طبقهبندی آماری است. این معیار با توجه به میزان دقت و بازیابی الگو:به انگلیسی یک طبقهبند محاسبه میشود که در آن دقت، نسبت تعداد نمونههای مثبت صادق به تعداد کل نمونههایی که مثبت پیشبینی شدهاند است و بازیابی، نسبت تعداد نمونههای مثبت صادق به تعداد کل نمونههای مثبت است. امتیاز F1 برابر با میانگین همساز دقت و بازیابی است. امتیاز عمومیتر یک پارامتر وزن هم دارد که یکی از معیارهای دقت یا بازیابی را بیش از دیگری تأثیر میدهد. بیشترین مقدار ممکن برای امتیاز اف، ۱ و کمترین مقدار ممکن برای این معیار ۰ است.
تعریف ریاضی
اندازهگیری سنتی امتیاز اف، برابر با میانگین هارمونیک دقت و بازیابی است.[۱]
- .
امتیاز Fβ
یک امتیاز عمومیتر است که از یک فاکتور مثبت حقیقی استفاده میکند و در این معیار طوری تعیین شدهاست که اهمیت بازیابی برابر اهمیت دقت باشد.
با توجه به خطای نوع اول و دوم این مقدار برابر خواهد بود با:
دو مقدار رایج برای مقادیر و هستند که مقدار به بازیابی وزن بیشتر و مقدار به دقت وزن بیشتری میدهد.
تست تشخیصی
وابستگی امتیاز اف به عدم تعادل کلاس
منحنی دقت و بازیابی و در نتیجه امتیاز اف، به شدت نسبت به تعداد نمونههای مثبت به منفی در دادهها وابسته هستند.[۲] این بدان معناست که مقایسه امتیاز اف در مسائل مختلف با نسبتهای کلاس متفاوت، مشکلساز است. یکی از راههای رفع این مشکل، استفاده از نسبت کلاس استاندارد هنگام انجام چنین مقایسههایی است.
کاربردها
امتیاز اف اغلب در زمینه بازیابی اطلاعات برای اندازهگیری عملکرد جستجو، طبقهبندی اسناد و طبقهبندی پرس و جو استفاده میشود.[۳] اکثر مطالعات قبلی بر روی امتیاز متمرکز بودند اما با گسترش موتورهای جستجو در مقیاس بزرگ، اهداف و عملکردها تغییر کردند تا تأکید بیشتری بر دقت یا بازیابی قرار گیرد.[۴] در نتیجه کاربرد وسیعی دارد.
امتیاز اف در یادگیری ماشین هم کاربرد وسیعی دارد.[۵] با این حال، امتیاز اف، منفیهای صادق را در نظر نمیگیرد، در نتیجه در برخی از مسائل، معیارهای ضریب همبستگی متیو و کاپای کوهن ممکن است برای ارزیابی عملکرد یک طبقهبند دودویی ترجیح داده شوند.[۶]
انتقادها
دیوید هند و دیگران از استفاده گسترده از امتیاز انتقاد میکنند زیرا به دقت و بازیابی اهمیت یکسانی میدهد. در عمل، انواع مختلف طبقهبندیهای نادرست، هزینههای متفاوتی را به همراه دارد. به عبارت دیگر، اهمیت نسبی دقت و بازیابی جنبهای از مشکل است.[۷] طبق گفتههای Davide Chicco و Giuseppe Jurman، ضریب همبستگی متیو در ارزیابی طبقهبندهای دودویی صادقانه و آموزندهتر است.[۸]
تعمیم به طبقهبندی چند کلاسه الگو:به انگلیسی
امتیاز اف، برای ارزیابی مسائل طبقهبندی با بیش از دو کلاس هم استفاده میشود. در این تنظیمات، امتیاز نهایی با میانگینگیری خرد (با در نظر گرفتن فراوانی کلاس) یا میانگینگیری کلان (با در نظر گرفتن همهٔ کلاسها به صورت یکسان) به دست میآید. برای میانگینگیری کلان، دو فرمول مختلف توسط متقاضیان استفاده شدهاست. یکی امتیاز اف برای میانگین دقت و بازیابی کلاسها، و یکی میانگین امتیاز اف که برای هر کلاس به صورت جداگانه محاسبه شدهاست.
جستارهای وابسته
- دقت و بازیابی
- جایگزین ارزشیابی دوزبانه
- منحنی مشخصه عملکرد سیستم
- ضریب همبستگی متیو
- ماتریس درهمریختگی
منابع
الگو:پانویس الگو:شاخصهای ارزشیابی یادگیری ماشینی
- ↑ الگو:Cite journal
- ↑ الگو:Cite conference
- ↑ الگو:Cite thesis
- ↑ الگو:Cite conference
- ↑ See, e.g. , the evaluation of the [۱].
- ↑ الگو:Cite arXiv
- ↑ الگو:Cite journal
- ↑ الگو:Cite journal