검색 결과

"이진 분류"에 대한 검색 결과 (총 52개)

교차 검증

기술 > 데이터과학 > 분석 | 익명 | 2025-09-17 | 조회수 137

# 교차 검증 ## 개요 **교차 검**(Cross-Validation, CV) 기계학습 통계 모델의 성능을가하고 과적(overfitting) 방지하기 위해 사용되는 기법입니다. 모델이 훈련 데이터만 잘 맞추어져 새로운 데이터에 대해서는 성능이 저하되는 문제를 사전에 검출하기 위해, 데이터를 여러 번 나누어 학습과 검증을 반복하는 방식으로 작동합니다. ...

필터 방법

기술 > 데이터과학 > 특성 분석 | 익명 | 2025-09-15 | 조회수 50

# 필터 방법 ## 개요**필터 방법**( Method)은 데이터과학, 특히 머신러닝과 통계 모델링에서 **특성 선택**(Feature Selection)을 수행하는 대표적인 기법 중 하나입니다. 이은 모델 훈련 과정에 의존하지 않고, 데이터 자체 통계적 특성만을 기반으로 각 특성의 중요도를 평가하여 불필요하거나 중복된 변수를 제거하는 것을 목표로 합니다...

VC 이론

기술 > 인공지능 > 머신러닝 | 익명 | 2025-09-15 | 조회수 63

# VC 이론 VC 이론(Vapnik-Chervonenkis Theory)은 통계적 학습 이론의 핵심 기반 중 하나로, 머신러닝 모델의 일반화 능력을 수학적으로 분석하는 데 중요한 역할을. 이 이론 블라드미르 바프니크(Vladimir Vapnik)와 알세이 체르보넨키스lexey Chervonenkis가 190년대 초반에 제안하였으며, 특히 **모델의 복잡...

분류

기술 > 머신러닝 > 분류 | 익명 | 2025-09-11 | 조회수 48

# 분류 ## 개요 **분류**(Classification)는 머신러닝에서 대표적인 지도 학습(Supervised Learning 과제 중 하나로, 주어 입력 데이터를 미리 정의된 **카테고리**(클래스) 중 하나로 할당하는 작업을 말합니다. 예 들어, 이메이 스팸인지 정상인지 판단하거나, 의료 데이터를 기반으로 환자가 특정 질병에 걸렸는지를 예측하는 ...

최적의 경계선

기술 > 인공지능 > 머신러닝 | 익명 | 2025-09-10 | 조회수 51

# 최적의 경계선 ## 개요 **최적 경계선**(Optimal Decision)은 머신러닝, 지도 학습(Supervised Learning)에서 분류(Classification) 문제 해결할 때 사용 핵심 개념 중 하나. 이는 서로 다른 클래스에 속한 데이터 포인트들을 가장 잘 구분할 수 있는 기하학적 경계를 의미합니다. 최적의 경계선은 모델이 새로운 ...

시그모이드 함수

교육 > 수학 > 시그모이드 함수 | 익명 | 2025-09-07 | 조회수 50

# 시그모이드 함수 ## 개요 시모이드 함수(Sigmoid Function)는 S자 형태의 곡선을 가지는 수학적 함수로, 특히 인공지능, 통계학, 생물학, 그리고 수학 교육 등 다양한 분야 중요한 역할을. 이 함수는 입력값이 매우 작을 때 출력값이 0에 가까워지고, 입력값이 매우 클 때는 출력값이 1에 가까워지는 특성을 가지며, 중간 영역에서는 부드러운...

긍정적 예측

기술 > 인공지능 > 모델 평가 | 익명 | 2025-09-06 | 조회수 81

# 긍정적 예측 ## 개요 **긍정적 예측**(Positive Prediction)은 인공지능, 특히 머신러닝 모델의 평가 과정에서 중요한 개념 중 하나로, 모델 특정 샘플이 "긍정 클래스(Positive Class)"에 속한다고 예측한 경우를 의미합니다. 이는 이진 분류(Binary Classification) 문제에서 자주 사용되는 용어이며, 모델의...

SVM

기술 > 머신러닝 > 분류 알고리즘 | 익명 | 2025-09-06 | 조회수 74

# SVM (서포트 벡터 머신) 서포트 벡터 머신(Support Vector Machine, SVM은 머신러닝 분에서 널리 사용되는 지도 학습 기반의 **분류 알고리즘**으로, 주로 이진 분류 문제에 사용되지만 다중 클래스 분류에도 확장 가능하다. SVM은 데이터 포인트를 고차원 공간으로 매핑하여 최적의 경계선(hyperplane)을 찾아 서로 다른 클래...

K-Fold Cross-Validation

기술 > 데이터과학 > 모델 평가 | 익명 | 2025-09-03 | 조회수 71

# K-Fold Cross- **K-Fold Cross-Validation**(K-겹 교차 검증)은 머신러닝과 통계 모델의 성능을 평가하기 위해 널리 사용되는 기입니다. 이 방법은 데이터를 여러 개의 부분으로 나누어 반복적으로 훈련과 검증을 수행함으로써 모델의 일반화 능력을 더 정확하게 평가할 수 있도록 도와줍니다. 특히, 데이터셋의 크기가 제한적일 때 ...

What-If Tool

기술 > 인공지능 > 도구 | 익명 | 2025-09-03 | 조회수 91

What-If Tool ## 개요**What-If ToolWIT)은 구글(Google)이 개발한 시각적 분석 도구로, 머신러닝 모델의 동작을 직관적으로 탐색하고 분석할 수 있도록 설계된 인공지능(AI) 도구입니다 이 도구는 머신러닝 모의 예측 결과를 시각화하고, 다양한 입력 조건을 변경했을 때 모델의 출력이 어떻게 달라지는지 실시간으로 확인할 수 있게 해...

BERT

기술 > 자연어처리 > 언어 모델링 | 익명 | 2025-09-02 | 조회수 56

# BERT ##요 BERT(Bidirectional Encoder Represent from Transformers)는글(Google)이 018년에 발표한 자연어 처리(N) 분야의 획기적인 언어 모델이다.ERT는 이전의 단방향 언어 모들과 달리 **방향 맥락**(bidirectional context)을 학습함으로써 단어의 의미를 보다 정확하게 이해할...

Bayesian Target Encoding

기술 > 데이터과학 > 데이터 인코딩 | 익명 | 2025-09-02 | 조회수 97

# Bayesian Target Encoding ## 개요 **베이지안 타겟 인코딩**(Bayesian Target Encoding)은 범주형 변수(categorical variable)를 수치형 변수로 변환하는 고급 인코딩 기법 중 하나로, 특히 머신러닝 모델의 성능 향상을 위해 사용된다. 이 기법은 단순한 타겟 인코딩(target encoding)의...

MLP

기술 > 인공지능 > 신경망 모델 | 익명 | 2025-09-02 | 조회수 58

# MLP ## 개요 **MLP**(Multi-Layer Perptron, 다층 퍼셉트론)은 인공신경망(Artificial Neural Network, ANN)의 가장 기본적이고 널리 사용되는 형태 중 하나입니다 단일 퍼셉트론은 선형적으로 분리 가능한 문제만 해결할 수 있지만, MLP는 여러 개의 은닉층(Hidden Layers)을 포함함으로써 **비선...

F1 점수

기술 > 인공지능 > 모델 평가 | 익명 | 2025-09-02 | 조회수 63

# F1 점수 ## 개요 F1 점수1 Score)는 인공지능 머신러닝 분야에서 분류 모델의 성능을 평가 데 널리 사용되는 지입니다. 특히 **밀도**(Precision)와 **재현율**(Recall)을 조화롭게 결합한 지표로, 두 값의 조화 평균(Harmonic Mean)을 계산하여 모델의 균형 잡힌 성능을 평가합니다. F1 점수는 불균형 데이터셋(Im...

목표 기반 인코딩

기술 > 데이터과학 > 데이터 인코딩 | 익명 | 2025-09-01 | 조회수 67

# 목표 기반 인코딩 목표 기반 인코딩(Target-based Encoding)은 범주형 변수(Categorical Variable)를 수치형 변수로 변환 데이터 인코딩법 중 하나로, 특히 지도 학습(Supervised Learning)에서 목표 변수(Target Variable)와의 관계를 활용하여 인코딩을하는 방법입니다. 이 방은 단순한 레이블 인코딩...

Mean Encoding

기술 > 데이터과학 > 인코딩 | 익명 | 2025-09-01 | 조회수 55

Mean Encoding ** Encoding**(평균코딩)은 범주형 변수(Categorical Variable)를 수치형 변수로 변환하는 고 인코딩 기법 중로, 주로 **지도 학습**(Supervised Learning)에서 회귀 또는 분류 문제에 활용됩니다. 이 방법은 범주형 변수의 각 범주(Category)를 그 범주에 해당하는 타겟 변수(Targe...

목표 변수

기술 > 데이터과학 > 데이터 전처리 | 익명 | 2025-09-01 | 조회수 66

# 목표 변수 ## 개 **목표 변수**(Target Variable)는 데이터 과학 및 머신러닝 분야에서 모델이 예측하거나 설명하려는 주요 변수를 의미합니다. 이는 종속 변수(Depend Variable), 응답 변수(Response Variable), 또는 출력 변수(Output Variable)라고도 불리며, 모델 학습의 중심이 되는 요소입니다. ...

데이터 인코딩 기법

기술 > 데이터과학 > 인코딩 | 익명 | 2025-09-01 | 조회수 58

# 데이터 인코딩 기법 데이터 인코딩 기법은 데이터 과학과 머신러닝 프로세스에서 매우 중요한 전처리 단계 중 하나입니다. 실제 데이터는 텍스트, 범주형 값, 날짜, 기호 등 다양한 형태로 존재하지만, 머신러닝 모델은 일반적으로 수치형 데이터만을 입력으로 처리할 수 있습니다. 따라서 범주형 변수나 텍스트 데이터를 모델이 이해할 수 있는 **수치 형태로 변환...

타겟 인코딩

기술 > 데이터과학 > 데이터 인코딩 | 익명 | 2025-09-01 | 조회수 52

# 타겟 인코딩 ## 개요 **타겟 인코딩**(Target)은 머신러닝과 데이터 과학에서 범주형 변수(categorical variable)를 수치형으로 변환하는 고급 인코딩 기법 중 하나입니다. 이 방법은 각 범주(category)를 해당 범주에 속하는 타겟(target) 변수의 통계적 요약값(예: 평균, 중앙값 등)으로 대체함으로써, 범주형 변수와 ...

타깃 인코딩

기술 > 데이터과학 > 인코딩 | 익명 | 2025-09-01 | 조회수 87

# 타깃 인코딩 ## 개요 **타깃 인코**(Target Encoding)은 범형 변수(Categorical Variable)를 수치형 변수로 변환하는 고급 인코딩 기법 중 하나로, 주어진 범주(category)의 값이 종속 변수(target variable)에 미치는 영향을 기반으로 인코딩을 수행합니다. 이 방법은 특히 범주가 많고 희소한(high-c...