دقت و بازیابی
دقت و بازیابی (انگلیسی: Precision and recall) یا دقت و بازیافت در بازشناخت الگو، بازیابی اطلاعات و طبقهبندی آماری کاربرد دارند. در حوزه یادگیری ماشینی، Precision به معنای درصدی از پیشبینیهای مدل که مرتبط هستند ولی recall اشاره به درصدی از کل پیشبینیهایی که توسط مدل درست دستهبندیشدهاند. به بیان سادهتر، «دقت» به این سؤال پاسخ میدهد که «چه مقدار از مواردی که شناسایی کردیم، درست بودند؟» و «بازیابی» به این سؤال پاسخ میدهد که «چه مقدار از مواردی که باید شناسایی میکردیم را شناسایی کردیم؟»[۱].
Recall برابر است با تقسیم تعداد مواردی که توسط مدل درست تشخیص دادهاند شده بر تعداد کل مواردی که توسط مدل ایجاد شدهاند و Precision برابر است با تقسیم تعداد مواردی که توسط مدل درست تشخیص داده شدهاست بر تعداد مواردی که واقعاً درست هستند، درست تشخیص داده شدهاند.
به عنوان مثال یک الگوریتم یادگیری ماشینی از میان ۱۲ تصویر سگ و گربه ۸ مورد سگ را تشخیص میدهد. از ۸ سگ ۵ مورد واقعاً سگ هستند (مثبت درست یا true positives) و ۳ مورد دیگر گربه هستند؛ که مثبت نادرست یا false positives هستند. مقدار precision برابر با ۵/۸ است و مقدار recall برابر با ۵/۱۲ هست.
وقتی موتور جستجو ۳۰ صفحه را بازمیگرداند و فقط ۲۰ موردش مرتبط هستند و به اشتباهاً ۴۰ مورد دیگر که مرتبط بودند را بازنمیگرداند. مقدار precision برابر با ۲۰/۳۰ = ۲/۳ و مقدار recall برابر با ۲۰/۶۰ = ۱/۳ است.
در نتیجه در این مورد precision نشان میدهد که چقدر موتور جستجو به درد بخور است و recall نشان میدهد که چه مقدار پاسخش کامل و جامع هست.
فرمول
[ویرایش]
تفاوت Accuracy, Precision, Recall و Specificity
[ویرایش]به عنوان مثال قصد داریم طی یک روند یادگیری نظارتشده مدلی برای پیشبینی بیماری سرطان ایجاد کنیم. برای آموزش مدل یک جامعه آماری تهیه میکنیم که تعدادی بیمار واقعاً سرطان درند و تعدادی هم ندارند و مدل را به کمک بخش آموزش، ایجاد میکنیم و بر روی بخش آزمون یا شاهد آن را اجرا میکنیم تا میزان خطا یا دقت مدل را بررسی کنیم.
- specificity عبارت است از کسری از جوابهای منفی که به درستی تشخیص داده شدهاست مثلاً درصد افرادی که طبق پیشبینی مدل سرطان ندارند و در دنیای واقعی هم سرطان ندارند.
- recall یا sensitivity یا بازیابی عبارتست از کسری از جوابهای مثبت که درست تشخیص داده شدهاند مثلاً درصد افرادی که طبق پیشبینی مدل سرطان دارند و در دنیای واقعی هم سرطان دارند.
- accuracy یا صحت یعنی مقدار اندازهگیری شده چقدر به مقدار واقعی نزدیک است برای accuracy باید precision بالا باشد ولی برعکسش لزوماً برقرار نیست. بالا بودن بایاس و واریانس به معنای accuracy کم است.
- precision یا دقت برای اندازهگیریهای متوالی از یک مقدار میزان نزدیک بودن مقدارهای اندازهگیری را نشان میدهد. مثلاً اگر یک ساعت هر روز فقط ۲ ساعت جلو رود مقدار accuracy یا صحتش پایین است ولی مقدار precision آن بالاست.
واقعیت | ||||||
جامعه آماری | در واقعیت مثبت | در واقعیت منفی | شیوع = Σ Condition positive/Σ Total population | صحت (ACC) = Σ True positive + Σ True negative/Σ Total population | ||
پیشبینی | پیشبینی مثبت |
مثبت صادق | مثبت کاذب خطای نوع اول |
Positive predictive value (PPV), دقت و بازیابی = Σ True positive/Σ Predicted condition positive | میزان کشف اشتباه (FDR) = Σ False positive/Σ Predicted condition positive | |
پیشبینی منفی |
منفی کاذب خطای نوع دوم |
منفی صادق | False omission rate (FOR) = Σ False negative/Σ Predicted condition negative | Negative predictive value (NPV) = Σ True negative/Σ Predicted condition negative | ||
حساسیت و ویژگی (TPR), دقت و بازیابی، حساسیت و ویژگی، probability of detection, توان آماری = Σ True positive/Σ Condition positive | False positive rate (FPR), بازیابی اطلاعات، probability of false alarm = Σ False positive/Σ Condition negative | Positive likelihood ratio (LR+) = TPR/FPR | Diagnostic odds ratio (DOR) = LR+/LR− | امتیاز اف ۱ = 2 · Precision · Recall/Precision + Recall | ||
False negative rate (FNR), Miss rate = Σ False negative/Σ Condition positive | حساسیت و ویژگی (SPC), Selectivity, حساسیت و ویژگی (TNR) = Σ True negative/Σ Condition negative | Negative likelihood ratio (LR−) = FNR/TNR |
واژگان و مشتقات
ماتریس درهمریختگی
- در واقعیت درست یا (P)
- تعداد موارد واقعاً مثبت در داده
- در واقعیت منفی یا (N)
- تعداد موارد واقعاً منفی در داده
- مثبت صادق یا (TP)
- مانند آژیر درست
- منفی صادق یا (TN)
- مانند سکوت درت
- مثبت کاذب یا (FP)
- معادل با آژیر کاذب، خطای نوع اول (هواپیمای دشمن نبوده ولی آژیر زده شده)
- منفی کاذب یا (FN)
- معادل با سکوت اشتباه خطای نوع دوم (هواپیمای دشمن بوده ولی آژیر زده نشده)
- recall، sensitivity، hit rate، یا true positive rate یا (TPR)
- specificity، selectivity یا true negative rate یا (TNR)
- precision یا positive predictive value یا (PPV)
- negative predictive value یا (NPV)
- رتبه ناموجود یا false negative rate یا (FNR)
- fall-out یا false positive rate یا (FPR)
- میزان کشف اشتباه (FDR)
- false omission rate (FOR)
- Threat score (TS) یا Critical Success Index (CSI)
- صحت و دقت (ACC)
- امتیاز اف ۱
- is the میانگین همساز بازیابی اطلاعات and حساسیت و ویژگی
- Matthews correlation coefficient (MCC)
- Informedness یا Bookmaker Informedness (BM)
- Markedness (MK)
منبع: Fawcett (2006),[۲] Powers (2011),[۳] Ting (2011),[۴] and CAWCR[۵]
جستارهای وابسته
[ویرایش]منابع
[ویرایش]- ↑ https://developers.google.com/machine-learning/crash-course/classification/precision-and-recall
- ↑ Fawcett, Tom (2006). "An Introduction to ROC Analysis" (PDF). Pattern Recognition Letters. 27 (8): 861–874. doi:10.1016/j.patrec.2005.10.010.
- ↑ Powers, David M W (2011). "Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation" (PDF). Journal of Machine Learning Technologies. 2 (1): 37–63.
- ↑ Ting, Kai Ming (2011). Encyclopedia of machine learning. Springer. ISBN 978-0-387-30164-8.
- ↑ Brooks, Harold; Brown, Barb; Ebert, Beth; Ferro, Chris; Jolliffe, Ian; Koh, Tieh-Yong; Roebber, Paul; Stephenson, David (2015-01-26). "WWRP/WGNE Joint Working Group on Forecast Verification Research". Collaboration for Australian Weather and Climate Research. World Meteorological Organisation. Retrieved 2019-07-17.
- مشارکتکنندگان ویکیپدیا. «Precision and recall». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۱۲ نوامبر ۲۰۱۹.