검색 결과

"k-NN"에 대한 검색 결과 (총 5개)

카테고리:

디멘셔널리티 문제

기술 > 데이터과학 > 분석 | 익명 | 2026-04-09 | 조회수 18

# 디멘셔널리티 문제 ## 개요 **디멘셔널리티 문제**(Dimensionality Problem), 또는 **차원의 저주**(Curse of Dimensionality)는 데이터 과학 및 머신러닝 분야에서 고차원 데이터를 다룰 때 발생하는 일련의 이슈를 의미합니다. 데이터의 차원(특징 수)이 증가함에 따라 데이터 공간의 기하학적 성질이 급격히 변화하며...

#디멘셔널리티 문제 #차원의 저주 #차원 축소 #특징 선택 #정규화 #데이터 과학

상호 정보량

기술 > 정보이론 > 특성 분석 | 익명 | 2025-11-13 | 조회수 57

# 상호 정보량 ## 개요 **상호 정보량**(Mutual Information, MI)은 정보이론에서 두 확률변수 간의 상관관계를 측정하는 중요한 개념입니다. 즉, 한 변수에 대한 정보가 다른 변수에 대해 얼마나 많은 정보를 제공하는지를 수치적으로 나타냅니다. 상호 정보량은 통계학, 기계학습, 신호처리, 자연어 처리 등 다양한 분야에서 변수 간의 종속...

#상호 정보량 #정보이론 #엔트로피 #특성 선택 #KL 발산

Min-Max Scaling

기술 > 데이터과학 > 정규화 | 익명 | 2025-10-03 | 조회수 74

# Min-Max Scaling **Min-Max Scaling**은 데이터 과학과 기계 학습 분야에서 널리 사용되는 **규화**(Normalization) 기법 중 하나로,의 범위를 일정한 구간(보통 0에서 1 사이)으로 조정하는 방법입니다. 이 기법은 각 특성(feature)의 스케일을 통일하여 알고리즘의 성능을 향상시키고, 학습 속도를 개선하는 데 ...

#Min-Max Scaling #정규화 #scikit-learn #데이터 전처리 #이상치 민감도

고차원 데이터

기술 > 데이터과학 > 분석 | 익명 | 2025-10-01 | 조회수 80

# 고차원 데이터 고차원 데이터(High-dimensional Data는 변수(특징)의가 관측치샘플)의 수보다 훨씬 많은 데이터를 의미합니다. 이러한는 현대 데이터 과학, 특히 생물정보학, 이미지 처리,어 처리, 금융 분석 등 다양한 분야에서 자주 등장하며, 분석의 복잡성과 도전 과제를 동반합니다. 본 문서에서는 고차원 데이터의 정의, 특성, 분석 시 발...

#일반 #문서

오버샘플링

기술 > 데이터과학 > 데이터 전처리 | 익명 | 2025-09-28 | 조회수 113

# 오버샘플링 ## 개요 오버샘플(Over-sampling은 기계 학습 데이터 과학 분야에서불균형 데이터(imbalanced data)** 문제를 해결하기 위해 사용되는 데이터 전 기법 중 하나. 불균형란 특정 클래스의 샘플 수가 다른에 비해 현히 적은 경우를 말하며, 이는 분류 모델의 성능에정적인 영향 미칠 수 있습니다. 예를, 질병 진 데이터에서 건...

#오버샘플링 #불균형 데이터 #SMOTE #ADASYN #데이터 전처리