위키너와나

데이터 누수

기술 > 데이터과학 > 데이터 전처리 | 익명 | 2026-06-20 | 조회수 3

# 데이터 누수 (Data Leakage) **데이터 누수(Data Leakage)**는 머신러닝 및 데이터 과학 모델의 학습 과정에서, 테스트 데이터(평가 데이터)에 포함되어야 할 정보가 우연히 또는 실수로 학습 데이터에 유입되어 모델이 실제 환경에서보다 과도하게 높은 성능을 보이는 현상을 의미합니다. 이는 모델의 일반화 능력(Generalization...

#데이터 누수 #머신러닝 #데이터 과학 #데이터 전처리 #특징 공학 #교차 검증 #스케일링 #결측치 처리 #시계열 데이터 #파이프라인

기계학습 기반 전처리

기술 > 머신러닝 > 모델 전처리 | 익명 | 2026-06-20 | 조회수 2

# 기계학습 기반 전처리 (Machine Learning-Based Preprocessing) ## 개요 **기계학습 기반 전처리(Machine Learning-Based Preprocessing)**는 전통적인 통계적 방법이나 규칙 기반 접근법을 넘어서, 머신러닝 알고리즘 자체를 활용하여 데이터의 품질을 개선하고 모델의 학습 성능을 최적화하는 과정을 ...

#기계학습 기반 전처리 #결측치 대체 #차원 축소 #이상치 탐지 #Autoencoder #GAN #Isolation Forest #데이터 누수

과적합

기술 > 인공지능 > 최적화 | 익명 | 2026-06-20 | 조회수 1

# 과적합 (Overfitting) **과적합**(過適合, Overfitting)은 기계 학습(Machine Learning) 및 통계 모델링에서 모델이 훈련 데이터(Training Data)에 지나치게 맞춰져, 새로운 unseen 데이터(테스트 데이터 또는 실제 데이터)에 대한 일반화 성능이 떨어지는 현상을 의미합니다. 즉, 모델이 데이터의 실제 패턴(...

#과적합 #기계학습 #일반화 #정규화 #드롭아웃 #교차검증 #조기종료 #데이터증강 #고급

데이터 품질 개선

기술 > 데이터과학 > 데이터 정제 | 익명 | 2026-06-20 | 조회수 4

# 데이터 품질 개선 (Data Quality Improvement) ## 개요 **데이터 품질 개선(Data Quality Improvement)**은 데이터의 정확성, 일관성, 완전성, 적시성 및 신뢰성을 높이기 위해 수행되는 체계적인 프로세스입니다. 현대 데이터 과학 및 비즈니스 인텔리전스(BI) 환경에서 '쓰레기 입력, 쓰레기 출력(Garbage...

#데이터 품질 #데이터 정제 #데이터 전처리 #결측치 처리 #이상치 탐지 #데이터 표준화 #데이터 거버넌스 #pandas #scikit-learn #ETL

모델 예측

기술 > 머신러닝 > 모델 평가 | 익명 | 2026-06-20 | 조회수 3

# 모델 예측 (Model Prediction) ## 개요 **모델 예측**(Model Prediction)은 머신러닝 및 딥러닝 분야에서 학습된 알고리즘이 새로운, 보지 못한 데이터(Unseen Data)에 대해 특정 결과를 도출해 내는 과정을 의미합니다. 모델 학습(Model Training)이 과거의 데이터(레이블이 있는 정답 데이터)를 통해 패턴...

#모델 예측 #머신러닝 #딥러닝 #추론 #평가 지표 #회귀 #분류 #과적합 #전처리 #MLOps

그레이디언트 부스팅

기술 > 인공지능 > 앙상블 학습 | 익명 | 2026-06-20 | 조회수 2

# 그레이디언트 부스팅 (Gradient Boosting) ## 개요 **그레이디언트 부스팅**(Gradient Boosting)은 머신러닝 분야에서 널리 사용되는 강력한 **앙상블 학습(Ensemble Learning)** 알고리즘 중 하나입니다. 이 기법은 약한 학습기(Weak Learner), 주로 결정 트리(Decision Tree)를 순차적으로...

#그레이디언트 부스팅 #앙상블 학습 #XGBoost #LightGBM #CatBoost #머신러닝 #하이퍼파라미터 튜닝 #결정 트리

알고리즘 트레이딩

기술 > 인공지능 > 응용 분야 | 익명 | 2026-06-20 | 조회수 6

# 알고리즘 트레이딩 (Algorithmic Trading) ## 개요 **알고리즘 트레이딩**(Algorithmic Trading), 줄여서 **알고트레이딩**은 금융 시장에서 투자 결정을 내리고 주문을 실행하는 과정을 컴퓨터 알고리즘을 통해 자동화하는 거래 방식을 의미합니다. 인간 트레이더의 개입을 최소화하거나 완전히 배제하고, 미리 정의된 규칙(R...

#알고리즘 트레이딩 #정량적 투자 #머신러닝 #딥러닝 #백테스팅 #고빈도 거래 #리스크 관리 #자연어 처리 #강화학습 #금융 기술

잔차 연결

기술 > 인공지능 > 신경망 구성 요소 | 익명 | 2026-06-20 | 조회수 0

# 잔차 연결 (Residual Connection) ## 개요 **잔차 연결**(Residual Connection), 또는 **잔차 학습**(Residual Learning)은 심층 신경망(Deep Neural Network)의 학습 효율성을 획기적으로 개선하기 위해 도입된 핵심 기법입니다. 이 개념은 특히 **딥러닝(Deep Learning)** ...

#잔차 연결 #ResNet #딥러닝 #신경망 아키텍처 #기울기 소실 #PyTorch #Transformer #심층 학습

에너지

기술 > 이미지 처리 > 텍스처 특징량 | 익명 | 2026-06-20 | 조회수 0

# 에너지 (Energy) **에너지(Energy)**는 이미지 처리 및 컴퓨터 비전 분야에서 **텍스처 특징량(Texture Feature)**을 추출하는 데 사용되는 핵심 지표 중 하나입니다. 주로 회귀 분석, 패턴 인식, 그리고 텍스처 분류 작업에서 이미지의 국소적 또는 전역적인 에너지 분포를 정량화하기 위해 활용됩니다. 이 문서는 에너지 기반 텍스...

#텍스처 특징량 #컴퓨터 비전 #이미지 처리 #에너지(Energy) #GLCM #Gabor 필터 #웨이블릿 #LBP #딥러닝

다양성

기술 > 인공지능 > 모델 설계 | 익명 | 2026-06-20 | 조회수 0

# 다양성 (Diversity) **다양성(Diversity)**은 인공지능, 특히 머신러닝과 딥러닝 모델 설계 및 훈련 과정에서 핵심적인 개념으로, 데이터의 분포, 모델의 예측 결과, 또는 학습 알고리즘의 행동이 단일한 패턴에 치우치지 않고 포괄적이고 균형 잡힌 상태를 유지하는 정도를 의미합니다. 현대 AI 시스템이 편향(Bias)을 최소화하고 일반화 ...

#다양성 #인공지능 #머신러닝 #딥러닝 #앙상블 학습 #데이터 증강 #생성형 AI #편향 #공정성 #고급

Pattern Recognition and Machine Learning

기술 > 인공지능 > 학술 자료 | 익명 | 2026-06-20 | 조회수 1

# Pattern Recognition and Machine Learning **Pattern Recognition and Machine Learning**(PRML)은 크리스 버즈비(Christopher M. Bishop)가 저술한 인공지능 및 기계 학습 분야의 고전적인 학술 교재입니다. 이 책은 패턴 인식과 기계 학습의 이론적 기초를 확률론적 관점에서...

#Pattern Recognition and Machine Learning #PRML #Christopher M. Bishop #기계 학습 #패턴 인식 #확률론적 접근 #베이지안 추론 #신경망 #서포트 벡터 머신 #고급

특징 강화

기술 > 데이터과학 > 분석 | 익명 | 2026-06-20 | 조회수 0

# 특징 강화 (Feature Enhancement) ## 개요 **특징 강화**(Feature Enhancement)는 데이터 과학 및 머신러닝 분야에서 원시 데이터(Raw Data)의 품질을 개선하거나, 기존 특징(Feature)의 표현력을 높여 모델의 예측 성능을 극대화하기 위한 일련의 전처리 및 변환 기법을 포괄하는 개념입니다. 단순히 결측치를 ...

#특징 강화 #Feature Engineering #데이터 전처리 #머신러닝 #PCA #임베딩 #과적합 방지 #데이터 과학

과적합

기술 > 머신러닝 > 모델 평가 | 익명 | 2026-06-20 | 조회수 3

# 과적합 (Overfitting) **과적합**(過適合, Overfitting)은 머신러닝 및 통계 모델링에서 학습 데이터에 지나치게 맞춰져 새로운 데이터, 즉 테스트 데이터나 실제 환경에서의 예측 성능이 저하되는 현상을 의미합니다. 이는 모델이 데이터의 일반적인 패턴(신호, Signal)을 학습하는 것이 아니라, 학습 데이터에 포함된 무작위 오차나 노...

#과적합 #머신러닝 #일반화 #정규화 #드롭아웃 #조기종료 #편향-분산 트레이드오프 #교차검증 #중급

꼬꼬마

기술 > 자연어 처리 > 도구 | 익명 | 2026-06-20 | 조회수 2

# 꼬꼬마 (Kkokkoma) **꼬꼬마**는 한국어 자연어 처리(NLP) 분야에서 널리 사용되는 오픈소스 텍스트 전처리 도구입니다. 주로 한국어의 형태소 분석, 불용어 제거, 어간 추출, 그리고 다양한 텍스트 정규화 작업을 효율적으로 수행하기 위해 설계되었습니다. 한국어는 교착어적 특성으로 인해 형태소 분석의 정확도가 후속 NLP 작업(예: 기계 번역,...

#꼬꼬마 #한국어 NLP #형태소 분석 #텍스트 전처리 #Python #오픈소스 #자연어 처리

CityHash

기술 > 데이터구조 > 해시 함수 | 익명 | 2026-06-20 | 조회수 3

# CityHash **CityHash**는 Google에서 개발한 해시 함수의 계열로, 특히 메모리 내 데이터 구조(예: 해시 테이블)에서의 빠른 연산 속도와 높은 품질의 분산 성능을 목표로 설계되었습니다. 이 함수는 64비트 및 128비트 해시 값을 생성할 수 있으며, 특히 짧은 문자열에 대해 뛰어난 성능을 보입니다. CityHash는 MurmurHa...

#CityHash #해시 함수 #Google #데이터 구조 #알고리즘 #인메모리 DB #x86-64 #오픈 소스

RSS

통계학 > 회귀분석 > 모델 평가 | 익명 | 2026-06-20 | 조회수 3

# RSS (Residual Sum of Squares) **RSS**(Residual Sum of Squares, 잔차 제곱합)는 통계학, 특히 **회귀분석(Regression Analysis)**에서 통계 모델의 적합도(Goodness of Fit)를 평가하는 핵심 지표 중 하나입니다. RSS는 관측된 데이터 값과 모델이 예측한 값 사이의 차이인 **...

#RSS #회귀분석 #모델 평가 #잔차 제곱합 #MSE #R-squared #통계학 #최소제곱법

변분 추론

기술 > 머신러닝 > 추론 방법 | 익명 | 2026-06-20 | 조회수 1

# 변분 추론 (Variational Inference) **변분 추론(Variational Inference, VI)**은 확률 모델에서 사후 확률(posterior distribution)을 근사하기 위한 방법론 중 하나입니다. 베이지안 통계학에서 사후 확률은 베이즈 정리를 통해 계산되지만, 많은 복잡한 모델에서 정확한 사후 확률의 계산은 불가능하거나...

#변분 추론 #베이지안 통계 #확률 모델 #ELBO #KL 발산 #VAE #SVI #중급

위양성율

기술 > 데이터과학 > 모델 평가 | 익명 | 2026-06-19 | 조회수 4

# 위양성율 (False Positive Rate) **위양성율**(False Positive Rate, 약자 **FPR**)은 이진 분류(Binary Classification) 문제에서 실제 음성(Negative)인 샘플 중 모델이 양성(Positive)으로 잘못 예측한 비율을 의미합니다. 즉, "사건이 발생하지 않았음에도 불구하고 사건이 발생했다고 ...

#위양성율 #False Positive Rate #FPR #이진 분류 #모델 평가 #ROC 곡선 #AUC #혼동 행렬 #특이도 #민감도

catastrophic forgetting

기술 > 인공지능 > 머신러닝 | 익명 | 2026-06-16 | 조회수 11

# 파괴적 망각 (Catastrophic Forgetting) 파괴적 망각은 연속 학습(Continual Learning) 환경에서 인공지능 모델이 새로운 작업을 학습하는 과정에서 기존 작업의 성능이 급격히 저하되는 현상을 의미합니다. 이는 인간 학습자가 새로운 지식을 습득하더라도 기존 지식을 완전히 잊지 않는 능력과 대비되는 머신러닝의 근본적인 한계 중...

#파괴적 망각 #연속 학습 #머신러닝 #딥러닝 #EWC #SI #Replay Buffer #가소성-안정성 딜레마

머신러닝

기술 > 인공지능 > 머신러닝 | 익명 | 2026-06-14 | 조회수 10

# 머신러닝(Machine Learning) 머신러닝은 명시적인 프로그래밍 없이 컴퓨터가 데이터를 통해 스스로 학습하고 패턴을 인식하여 예측 또는 결정을 내리는 인공지능(AI)의 핵심 하위 분야입니다. ## 머신러닝의 개요와 정의 머신러닝은 아서 사무엘(Arthur Samuel)이 1959년 "컴퓨터가 특정 작업을 수행하기 위해 명시적인 명령어 없이 ...

#머신러닝 #인공지능 #딥러닝 #지도학습 #비지도학습 #강화학습 #선형회귀 #SVM #의사결정나무 #과적합

검색 결과