امتیاز اف ۱

از testwiki
نسخهٔ تاریخ ۷ مارس ۲۰۲۳، ساعت ۰۰:۵۴ توسط imported>Tarikhejtemai (ابرابزار)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو
دقت و بازیابی

در تجزیه و تحلیل طبقه‌بندهای آماری، امتیاز اف الگو:به انگلیسی معیاری برای ارزیابی دقت یک مدل طبقه‌بندی آماری است. این معیار با توجه به میزان دقت و بازیابی الگو:به انگلیسی یک طبقه‌بند محاسبه می‌شود که در آن دقت، نسبت تعداد نمونه‌های مثبت صادق به تعداد کل نمونه‌هایی که مثبت پیش‌بینی شده‌اند است و بازیابی، نسبت تعداد نمونه‌های مثبت صادق به تعداد کل نمونه‌های مثبت است. امتیاز F1 برابر با میانگین همساز دقت و بازیابی است. امتیاز عمومی‌تر Fβ یک پارامتر وزن هم دارد که یکی از معیارهای دقت یا بازیابی را بیش از دیگری تأثیر می‌دهد. بیشترین مقدار ممکن برای امتیاز اف، ۱ و کمترین مقدار ممکن برای این معیار ۰ است.

تعریف ریاضی

اندازه‌گیری سنتی امتیاز اف، برابر با میانگین هارمونیک دقت و بازیابی است.[۱]

F1=2recall1+precision1=2precisionrecallprecision+recall=2tp2tp+fp+fn.

امتیاز Fβ

Fβ یک امتیاز F عمومی‌تر است که از یک فاکتور مثبت حقیقی β استفاده می‌کند و در این معیار β طوری تعیین شده‌است که اهمیت بازیابی β برابر اهمیت دقت باشد.

Fβ=(1+β2)precisionrecall(β2precision)+recall

با توجه به خطای نوع اول و دوم این مقدار برابر خواهد بود با:

Fβ=(1+β2)true positive(1+β2)true positive+β2false negative+false positive

دو مقدار رایج برای β مقادیر 2 و 0.5 هستند که مقدار 2 به بازیابی وزن بیشتر و مقدار 0.5 به دقت وزن بیشتری می‌دهد.

تست تشخیصی

الگو:نمودار آزمون و تشخیص

وابستگی امتیاز اف به عدم تعادل کلاس

منحنی دقت و بازیابی و در نتیجه امتیاز اف، به شدت نسبت به تعداد نمونه‌های مثبت به منفی در داده‌ها وابسته هستند.[۲] این بدان معناست که مقایسه امتیاز اف در مسائل مختلف با نسبت‌های کلاس متفاوت، مشکل‌ساز است. یکی از راه‌های رفع این مشکل، استفاده از نسبت کلاس استاندارد r0 هنگام انجام چنین مقایسه‌هایی است.

کاربردها

امتیاز اف اغلب در زمینه بازیابی اطلاعات برای اندازه‌گیری عملکرد جستجو، طبقه‌بندی اسناد و طبقه‌بندی پرس و جو استفاده می‌شود.[۳] اکثر مطالعات قبلی بر روی امتیاز F1 متمرکز بودند اما با گسترش موتورهای جستجو در مقیاس بزرگ، اهداف و عملکردها تغییر کردند تا تأکید بیشتری بر دقت یا بازیابی قرار گیرد.[۴] در نتیجه Fβ کاربرد وسیعی دارد.

امتیاز اف در یادگیری ماشین هم کاربرد وسیعی دارد.[۵] با این حال، امتیاز اف، منفی‌های صادق را در نظر نمی‌گیرد، در نتیجه در برخی از مسائل، معیارهای ضریب همبستگی متیو و کاپای کوهن ممکن است برای ارزیابی عملکرد یک طبقه‌بند دودویی ترجیح داده شوند.[۶]

انتقادها

دیوید هند و دیگران از استفاده گسترده از امتیاز F1 انتقاد می‌کنند زیرا به دقت و بازیابی اهمیت یکسانی می‌دهد. در عمل، انواع مختلف طبقه‌بندی‌های نادرست، هزینه‌های متفاوتی را به همراه دارد. به عبارت دیگر، اهمیت نسبی دقت و بازیابی جنبه‌ای از مشکل است.[۷] طبق گفته‌های Davide Chicco و Giuseppe Jurman، ضریب همبستگی متیو در ارزیابی طبقه‌بندهای دودویی صادقانه و آموزنده‌تر است.[۸]

تعمیم به طبقه‌بندی چند کلاسه الگو:به انگلیسی

امتیاز اف، برای ارزیابی مسائل طبقه‌بندی با بیش از دو کلاس هم استفاده می‌شود. در این تنظیمات، امتیاز نهایی با میانگین‌گیری خرد (با در نظر گرفتن فراوانی کلاس) یا میانگین‌گیری کلان (با در نظر گرفتن همهٔ کلاس‌ها به صورت یکسان) به دست می‌آید. برای میانگین‌گیری کلان، دو فرمول مختلف توسط متقاضیان استفاده شده‌است. یکی امتیاز اف برای میانگین دقت و بازیابی کلاس‌ها، و یکی میانگین امتیاز اف که برای هر کلاس به صورت جداگانه محاسبه شده‌است.

جستارهای وابسته

منابع

الگو:پانویس الگو:شاخص‌های ارزشیابی یادگیری ماشینی