# Outlier Detection (이상치 탐지) ## 개요 Outlier Detection(이상치 탐지)은 데이터 집합에서 **다른 관측값들과 현저히 차이가 나는 데이터 포인트**를 식별하는 과정을 말한다. 이상치는 측정 오류, 데이터 입력 실수, 혹은 실제로 중요한 특이 현상을 나타낼 수 있기 때문에, 분석 단계에서 **제거, 보정, 혹은 별도 분석...
검색 결과
검색어를 입력하세요.
# Topological Data Analysis 개요 **Topological Data**(TDA, 위상 데이터석)는 데이터의 형상(형태과 구조를 위상수학의 원리를 활용해 분석하는 데이터 과학의 한 분야입니다. 전적인 통계적 방법이나 머신러닝 기법이 주로 데이터의 수치적 관계나 분포에 집중한다면, TDA는 데이터가 형성하는 **기하학적 구조**와 *...
# 해싱 트릭## 개요 **해싱 트**(Hashing Trick)은 기 학습 및 데이터 과학 분야 고차원의 범주형 데이터를 효율적으로 처리하기 위한 기술이다. 특히 자연어 처리(NLP)나 대규모 범주형 피처를 다룰 때, 원-핫 인코딩(Oneot Encoding)과 같은 전통적인 인코 방식이 메모리와 계산 자원을 과도하게 소모하는 문제를 해결하기 위해 제안...
# 리지 회귀 리지 회귀(Ridge Regression) 선형 회귀 분석의종이지만, **과적합**(overfitting)을 방지하기 위해 정규화(regularization) 기법을 적용한 고급 회귀 모델이다. 특히 독 변수들 사이에 **다중공선성**(multicollinearity)이 존재할 때 일반 선형 회귀보다 더 안정적인 계수 추정을 제공한다. 리지...