# ROC Curve (Receiver Operating Characteristic Curve) ## 개요 **ROC 곡선**(Receiver Operating Characteristic Curve)은 이진 분류(Binary Classification) 모델의 성능을 평가하고 시각화하는 데 널리 사용되는 그래프입니다. 주로 의료 진단, 스팸 필터링, 신...
검색 결과
검색어를 입력하세요.
# 위양성율 (False Positive Rate) **위양성율**(False Positive Rate, 약자 **FPR**)은 이진 분류(Binary Classification) 문제에서 실제 음성(Negative)인 샘플 중 모델이 양성(Positive)으로 잘못 예측한 비율을 의미합니다. 즉, "사건이 발생하지 않았음에도 불구하고 사건이 발생했다고 ...
# 레이블의 분포 (Label Distribution) ## 개요 **레이블의 분포(Label Distribution)**는 기계 학습(Machine Learning) 및 데이터 과학 분야에서 분류(Classification) 문제의 타겟 변수(Target Variable)가 데이터셋 내에서 어떻게 할당되어 있는지를 나타내는 통계적 특성입니다. 특히 지...
# ROC 곡선 ## 개요 ROC 곡선(Receiver Operatingistic Curve, 수기 운영 특성 곡선)은 이진류 모델의 성능을각적으로 평가하고 비교하는 데 사용되는 중요한 도입니다. ROC 곡선은 다양한 분류 임계값(threshold)에 **민감도**(감지율, 재현율)와 **위양성율**(거짓 양성 비율)을 비교하여 모델의 판별 능력을 분석...
# 불균형 데이터 ## 개요 불균형 데이터(Imbalanced Data)는 분류 문제에서 특정 클래스가 다른 클래스에 비해 극단적으로 적게 나타나는 데이터 세트를 의미합니다. 이 현상은 금융 사기 탐지, 의료 진단, 이상 감지 등 다양한 실생활 응용 분야에서 흔히 발생하며, 모델 학습과 평가에 심각한 영향을 미칩니다. 본 문서에서는 불균형 데이터의 정의,...