Ano ang precision at recall sa data mining?
Ano ang precision at recall sa data mining?

Video: Ano ang precision at recall sa data mining?

Video: Ano ang precision at recall sa data mining?
Video: What's the difference between accuracy and precision? - Matt Anticole 2024, Mayo
Anonim

Habang katumpakan tumutukoy sa porsyento ng iyong mga resulta na may kaugnayan, alalahanin ay tumutukoy sa porsyento ng kabuuang nauugnay na mga resulta na wastong inuri ayon sa iyong algorithm. Para sa iba pang mga problema, kailangan ang isang trade-off, at kailangang gumawa ng desisyon kung i-maximize katumpakan , o alalahanin.

Higit pa rito, ano ang precision at recall na may halimbawa?

Halimbawa ng Katumpakan - Alalahanin panukat upang suriin ang kalidad ng output ng classifier. Katumpakan - Alalahanin ay isang kapaki-pakinabang na sukatan ng tagumpay ng hula kapag ang mga klase ay napaka-imbalanced. Sa paghahanap ng impormasyon, katumpakan ay isang sukatan ng kaugnayan ng resulta, habang alalahanin ay isang sukatan kung gaano karaming mga tunay na nauugnay na resulta ang ibinalik.

Sa tabi sa itaas, paano mo kinakalkula ang katumpakan at pag-recall sa data mining? Halimbawa, ang perpektong katumpakan at marka ng pagbabalik ay magreresulta sa perpektong marka ng F-Measure:

  1. F-Measure = (2 * Precision * Recall) / (Precision + Recall)
  2. F-Measure = (2 * 1.0 * 1.0) / (1.0 + 1.0)
  3. F-Measure = (2 * 1.0) / 2.0.
  4. F-Sukatan = 1.0.

Ang dapat ding malaman ay, ano ang precision sa data mining?

Sa pattern recognition, information retrieval at pag-uuri (pag-aaral ng makina), katumpakan (tinatawag ding positive predictive value) ay ang fraction ng mga nauugnay na instance sa mga nakuhang instance, habang ang recall (kilala rin bilang sensitivity) ay ang fraction ng kabuuang halaga ng mga nauugnay na instance na

Bakit natin ginagamit ang precision at recall?

Ang katumpakan ay tinukoy bilang ang bilang ng mga totoong positibo na hinati sa bilang ng mga tunay na positibo kasama ang bilang ng mga maling positibo. Habang alalahanin nagpapahayag ng kakayahang hanapin ang lahat ng nauugnay na pagkakataon sa isang dataset, katumpakan nagpapahayag ng proporsyon ng mga punto ng data na sinasabi ng aming modelo na may kaugnayan at talagang may kaugnayan.

Inirerekumendang: