728x90
이진 분류는 분류 규칙에 따라 집합의 요소를 두 그룹으로 분류하는 작업입니다

참 양성(true positive, TP)
참 음성(true negative, TN)
거짓 양성(false positive, FP)

거짓 음성(false negative, FN)

  Virus 있음 Virus 없음
Pos. (있음)으로 판명 TP (True Positive) FN (False Negative)
Neg. (없음)으로 판명 FP (False Positive) TN (True Negative)

 

평가 점수

정확도 (accuracy)

       ACC=(TP+TN)/(TP+TN+FP+FN)

 

정밀도 (precision) - 실제 virus가 있는데, 있다고 판명한 경우

       PPV = TP / (TP + FP)

 

재현율 (recall) - virus가 있다고 판명했는데 실제 virus가 있는 경우

       TPR = TP / (TP + FN)

 

거짓 경보 (false alarm) - virus가 없다고 판명했는데 실제 virus가 있는 경우

       FPR = FP / (FP + TN)

 

 


예시

다음은 안티바이러스 프로그램의 성능 평가 실험을 한 결과이다.

  • 실험을 한 총 파일은 1200개이다.
  • 이 중에서 악성코드가 있는 파일의 수는 100개이다.
  • 실험 결과 악성 코드가 있는 파일 중에서 90개의 파일이 악성 코드가 있는 것으로 판명 되었다.
  • 실험 결과 악성 코드가 없는 파일 중에서 1000개의 파일이 악성 코드가 없는 것으로 판 명되었다.

(1) 이 안티바이러스의 정밀도(precision)는 얼마인가?

(2) 이 안티바이럿의 재현율(recall)은 얼마인가?

(3) 거짓 경보(false alarm)는 얼마인가?

(4) 정확도(accuracy)는 얼마인가? 

 


풀이

  Virus 있음 Virus 없음
Pos. (있음)으로 판명 TP = 90 FN = 100
Neg. (없음)으로 판명 FP = 10 TN = 1000

(1) 이 안티바이러스의 정밀도(precision)는 얼마인가?

       답 : TP / (TP + FP) = 90 / 100

 

(2) 이 안티바이럿의 재현율(recall)은 얼마인가?

       답 :  TP / (TP + FN) = 90 / 190

 

(3) 거짓 경보(false alarm)는 얼마인가?

       답 :  FP / (FP + TN) = 10/1010

 

(4) 정확도(accuracy)는 얼마인가? 

       답 :  (TP + TN) / (TP + TN + FP + FN) = 1090 / 1200

 

 

'서버 > 암호' 카테고리의 다른 글

부트킷 (bootkit)  (0) 2021.07.29
루트킷 (rootkit)  (0) 2021.07.29
익스플로잇 (exploit)  (0) 2021.07.27
멀웨어(malware)  (0) 2021.07.27
TLS 내부  (0) 2021.03.25

+ Recent posts