검색 결과

"언더샘플링"에 대한 검색 결과 (총 7개)

Label Bias Problem

기술 > 머신러닝 > 모델 평가 | 익명 | 2025-09-29 | 조회수 20

# Label Bias Problem ## 개요 **Label Bias Problem**(라벨 편향 문제)은 머신러닝, 특히건부 확률 모(Conditional Random Fields, CRFs 등과 순차적 데이터(sequence modeling)를 다루는 모델에서 자주 발생하는 이슈로, 모델이 특정 출력 라벨(클래스)에 지나치게 편향되어 다른 라벨을 ...

오버샘플링

기술 > 데이터과학 > 데이터 전처리 | 익명 | 2025-09-28 | 조회수 16

# 오버샘플링 ## 개요 오버샘플(Over-sampling은 기계 학습 데이터 과학 분야에서불균형 데이터(imbalanced data)** 문제를 해결하기 위해 사용되는 데이터 전 기법 중 하나. 불균형란 특정 클래스의 샘플 수가 다른에 비해 현히 적은 경우를 말하며, 이는 분류 모델의 성능에정적인 영향 미칠 수 있습니다. 예를, 질병 진 데이터에서 건...

FP

기술 > 데이터과학 > 혼동 행렬 | 익명 | 2025-09-27 | 조회수 19

FP **FP**(False Positive, 위양성)는 데이터, 특히 머신러닝과 통계 분석에서 중요한 개념 중 하나로, **모델이 실제로는 부정 클래스**(Negative) **인 사례를 잘못되어 양성 클래스**(Positive) **로 예측한 경우**를 의미합니다. 혼동 행렬(Confusion Matrix)에서 FP는 모델의 오분류 오류를 나타내는 네...

예측 정확도 균형

기술 > 인공지능 > 공정성 | 익명 | 2025-09-02 | 조회수 33

# 예측 정확도 균형 ## 개요 **예측 정확도 균형**(Predictive Parity)은 인공지능I) 시스템, 특히 머신러닝 모델이 다양한 집단(예: 인종, 성별, 연령대 등)에 대해 동일한 수준의 예측 정확도를 유지하는 것을 의미합니다. 이 개념은 AI의 **공정성**(Fairness)을 평가하는 핵심 지표 중 하나로, 특정 집단이 다른 집단보다 ...

목표 변수

기술 > 데이터과학 > 데이터 전처리 | 익명 | 2025-09-01 | 조회수 38

# 목표 변수 ## 개 **목표 변수**(Target Variable)는 데이터 과학 및 머신러닝 분야에서 모델이 예측하거나 설명하려는 주요 변수를 의미합니다. 이는 종속 변수(Depend Variable), 응답 변수(Response Variable), 또는 출력 변수(Output Variable)라고도 불리며, 모델 학습의 중심이 되는 요소입니다. ...

불균형 데이터

기술 > 데이터과학 > 분석 | 익명 | 2025-07-13 | 조회수 39

# 불균형 데이터 ## 개요 불균형 데이터(Imbalanced Data)는 분류 문제에서 특정 클래스가 다른 클래스에 비해 극단적으로 적게 나타나는 데이터 세트를 의미합니다. 이 현상은 금융 사기 탐지, 의료 진단, 이상 감지 등 다양한 실생활 응용 분야에서 흔히 발생하며, 모델 학습과 평가에 심각한 영향을 미칩니다. 본 문서에서는 불균형 데이터의 정의,...

분류

기술 > 데이터과학 > 분석 | 익명 | 2025-07-11 | 조회수 72

# 분류 (Classification) ## 개요 분류(Classification)는 데이터과학에서 가장 핵심적인 기계학습(ML) 기법 중 하나로, 주어진 데이터를 사전 정의된 범주 또는 클래스에 할당하는 과정을 의미합니다. 이는 **지도학습(Supervised Learning)**의 대표적 유형으로, 입력 데이터(X)와 그에 해당하는 레이블(Y)을 기반...