# 가중치 평균 ## 개요 **가중치 평균**(Weighted Average)은 단순 평균(Arithmetic Mean)과 달리 각 신뢰도를 반영하기 위해 **가중치**(Weight)를 부여하여 계산하는 평균 방식입니다. 특히 **데이터과학**과 **모델 평가** 분야에서 다양한 지표를 종합하거나, 클래스 불균형이 있는 분류 문제에서 성능을 평가할 때 ...
검색 결과
"소수 클래스"에 대한 검색 결과 (총 9개)
# F1 스코어 ## 개요 F1 스코어(F1 Score)는 기계학습과 데이터과학 분야에서 분류 모델의 성능을 평가하는 데 널리 사용되는 지표 중 하나입니다. 특히 **정밀도(Precision)**와 **재현율(Recall)**이 모두 중요한 상황에서 두 지표의 조화 평균(Harmonic Mean)을 계산하여 모델의 균형 잡힌 성능을 평가하는 데 유용합니...
# Label Bias Problem ## 개요 **Label Bias Problem**(라벨 편향 문제)은 머신러닝, 특히건부 확률 모(Conditional Random Fields, CRFs 등과 순차적 데이터(sequence modeling)를 다루는 모델에서 자주 발생하는 이슈로, 모델이 특정 출력 라벨(클래스)에 지나치게 편향되어 다른 라벨을 ...
# 샘플링 ## 개요 **샘플링**()은 전체 모집(Population)에서 일부 선택하여 그 특성을 조사함으로써 모단의 성질을 추정하는 통계적 방법이다. 현실 세계 모든 데이터를 수집하거나 분석하는 것은 비용, 시간 자원 등의 제약으로 인해 불능한 경우가 많기 때문에, 데이터과학에서는 샘플링을 통해 효율적이고 신뢰성 있는 분석을 수행한다. 샘플링은 사...
# 오버샘플링 ## 개요 오버샘플(Over-sampling은 기계 학습 데이터 과학 분야에서불균형 데이터(imbalanced data)** 문제를 해결하기 위해 사용되는 데이터 전 기법 중 하나. 불균형란 특정 클래스의 샘플 수가 다른에 비해 현히 적은 경우를 말하며, 이는 분류 모델의 성능에정적인 영향 미칠 수 있습니다. 예를, 질병 진 데이터에서 건...
# 매크로 F1 ## 개요 **매크로 F1Macro F1)은중 클래스 분류(Multiclass Classification) 문제에서 모델의 성능을 평가하기 위한 지표 중 하나로, 각 클래스별 **F1 점수**(F1 Score)를 계산한 후, 이를 단순 평균하여 전체 성능을 평가하는 방식을 의미한다. 이 지표는 클래스 간 불균형이 존재하는 경우에도 각 클...
# 샘플링 ## 개요 **샘플링**(Sampling)은 전체 모집단(Population에서 일부를 선택하여 그 특성을 조사함으로써 모집단 성질을 추정하는계적 방법이다. 데이터과학 분야에서 샘플링은규모 데이터셋 효율적으로 처리하고 분석하는 데심적인 역할을 한다. 특히 빅데이터 환경에서 전체 데이터를 처리하는 것이 비용이나 시간 측면에서 비효율적일 경우, ...
# 목표 변수 ## 개 **목표 변수**(Target Variable)는 데이터 과학 및 머신러닝 분야에서 모델이 예측하거나 설명하려는 주요 변수를 의미합니다. 이는 종속 변수(Depend Variable), 응답 변수(Response Variable), 또는 출력 변수(Output Variable)라고도 불리며, 모델 학습의 중심이 되는 요소입니다. ...
# 불균형 데이터 ## 개요 불균형 데이터(Imbalanced Data)는 분류 문제에서 특정 클래스가 다른 클래스에 비해 극단적으로 적게 나타나는 데이터 세트를 의미합니다. 이 현상은 금융 사기 탐지, 의료 진단, 이상 감지 등 다양한 실생활 응용 분야에서 흔히 발생하며, 모델 학습과 평가에 심각한 영향을 미칩니다. 본 문서에서는 불균형 데이터의 정의,...