위키너와나

L2 노름

수학 > 선형대수학 > 노름 | 익명 | 2025-09-03 | 조회수 130

# L2 노름## 개요 **L2 노름L2 norm) 벡터 공간에서 벡터의 크기 또는 길이를 측정하는 방법 중 하나로, 선형수학, 기계학습, 신호, 수치해 등 다양한 분야에서 널리 사용되는 중요한 개념이다. L2 노름은 유클리드 노름(Euclidean norm)이라고도 하며, 일반적인 직관적인 '' 개념과 일한다. 이 문서에서는2 노름의의, 수학 표현, 성...

#L2 노름 #선형대수학 #정규화 #스펙트럴 노름 #SVD

TF-IDF

기술 > 자연어처리 > 언어 모델링 | 익명 | 2025-09-03 | 조회수 78

# TF-IDF ## 개요 TF-IDF(Term Frequency-Inverse Document Frequency)는어처리(NLP) 분야에서 텍스트 데이터의 중요도를 수치화 대표적인 통계적 측정 기법입니다. 이 방법은 특정 단어가 하나의 문서 내에서 얼마나 자주 등장하는지(빈도)와 동시에 전체 문서 집합(corpus) 내에서 그 단어가 얼마나 희소하게 ...

#TF-IDF #자연어처리 #텍스트 마이닝 #기계학습 #Scikit-learn #초급

K-Fold 타겟 인코딩

기술 > 데이터과학 > 모델 평가 | 익명 | 2025-09-03 | 조회수 76

K-Fold 타 인코딩 개요 **K-Fold 타겟 인코딩**(K-Fold Target Encoding)은 범주형 변수(Categorical Variable)를 수치형 변수로 변환 고급 인코 기법 중 하나로, 특히 **과적합**(Overfitting) 방지하기 위해계된 방법입니다. 범주형 변수의 카테고리를 해당테고리에하는 타겟 변수의 평균값으로 대체하는...

#K-Fold 타겟 인코딩 #데이터 리크 방지 #범주형 변수 인코딩 #과적합 감소 #중급

smoothing parameter

기술 > 머신러닝 > 모델 최적화 | 익명 | 2025-09-03 | 조회수 72

# smoothing parameter ## 개요 **Smoothing parameter**(스무딩 파라터)는 머신러닝 및계 모델링에서 데이터의 노이즈ise)를 줄 모델의 일반화능을 향상시키기 위해 사용되는 중요한 하이퍼파라미터입니다. 이 파라미터 모델이 데이터에 **과적합overfitting)되는 것을 방지하고, 관측된 데이터의 불확실성이나 변동성을 ...

#smoothing parameter #kernel density estimation #나이브 베이즈 #모델 최적화 #편향-분산 트레이드오프

n-그램 모델

기술 > 자연어 처리 > 언어 모델 | 익명 | 2025-09-03 | 조회수 75

# n-그램 모델## 개요 **n-그램 모델**(n-gram model)은 자연어 처리(Natural Language Processing NLP) 분에서 언어의 확률적 구조를 모링하기 위해 널리 사용되는 통계 기반 언어 모델이다. 이 모델은 주어진 단어 시퀀스에서 다음 단어가 등장할 확률을 이전의 *n-1*개 단어를 기반으로 예측하는 방식을 취한다. n-...

#n-그램 모델 #자연어 처리 #마르코프 가정 #통계적 언어 모델 #스무딩 기법

GPT

기술 > 자연어처리 > 언어 모델링 | 익명 | 2025-09-02 | 조회수 83

# GPT ## 개요 **GPT**(Generative Pre-trained Transformer)는 오픈AI(OpenAI)에서발한 자연어 처리(NLP) 분야의 대표적인 언어 모델 시리즈로, 트랜스포머(Transformer) 아키텍처를 기반으로 한 생성형 사전 훈련 모델입니다. GPT는 대량의 텍스트 데이터를 이용해 사전 훈련된 후, 특정 작업에 맞게 ...

#GPT #트랜스포머 #대규모 언어 모델 #자연어 처리 #미세 조정 #프롬프트 기반 학습 #자기 주의 #ChatGPT #LLM #오픈AI

MSE

기술 > 인공지능 > 성능 평가 | 익명 | 2025-09-02 | 조회수 73

# MSE ## 개요 **MSE**(Mean Squared Error, 평균 제곱 오차)는 인공지능 및 기계학습 모델의 성능을 평가하는 대표적인 회귀(regression) 문제 지표 중 하나입니다. 예측값과 실제 관측값 사이의 차이를 제곱한 후, 그 평균을 취함으로써 모델의 예측 정확도를 수치화합니다. MSE는 오차의 크기를 강조하며, 특히 큰 오차에 ...

#MSE #회귀 분석 #성능 평가 #평균 제곱 오차 #이상치 민감도

R²

기술 > 인공지능 > 모델 평가 | 익명 | 2025-09-02 | 조회수 85

# R² ## 개요 **R²**(R-squared, 결정계수)는 통계학 및 기계학습에서 회귀 모델의 성능을가하는 대표 지표 중 하나입니다. R² 모델이 종속 변수(dependent variable)의 분산 중 얼마나 많은 부분을 설명할 수 있는지를 나타내는 값으로, 일반적으로 0에서 1 사이의 값을 가집니다. 이 값이 1에 가까울수록 모델이 데이터의 변...

#R² #회귀 분석 #결정계수 #Adjusted R² #모델 평가

BLAS

기술 > 수학 > 수치해석 | 익명 | 2025-09-02 | 조회수 80

# BLAS ## 개요 **BLAS**(Basic Linear Algebra Subprograms, 기본 선형대수 서브프로그램)는 벡터와 행렬 연산을 위한 표준 인터페이스를 정의한 소프트웨어 라이브러리입니다. 주로 수치해석, 과학기술 계산, 머신러닝, 고성능 컴퓨팅(HPC) 분야에서 핵심적인 역할을 하며, 선형대수 계산의 효율성과 성능을 극대화하는 데 ...

#BLAS #선형대수 #고성능 컴퓨팅 #행렬 연산 #OpenBLAS #cuBLAS #성능 최적화 #LAPACK #수치해석 #GEMM

순서형 범주

기술 > 데이터과학 > 인코딩 | 익명 | 2025-09-02 | 조회수 68

# 순서형 범주 ## 개요 **순서형 범주**(Ordinal Category)는 범주형 데이터의 한류로, 특정한 순서나 등급이 존재하는 범주를 의미합니다. 데이터 과학과 통계 분석에서 데이터는 일반적으로 **정량형**(수치형)과 **정성형**(범주형)으로 나뉘며, 정성형 데이터는 다시 **명목형 범주**(Nominal Category)와 **순서형 범주...

#순서형 범주 #데이터 인코딩 #서열 정보 #데이터과학 #Ordinal Encoding

GPT

기술 > 인공지능 > 신경망 모델 | 익명 | 2025-09-02 | 조회수 79

GPT ##요 **G**(Generative Pre-trained Transformer)는 오픈AI(OpenAI에서 개발한 대규모 언어 모델(Large Language Model, LLM) 시리즈로, 자연어를 생성하고 이해하는 데 특화된 딥러닝 기반의 신경망 아키텍처입니다. GPT 트랜스포머(Transformer) 아키텍처를 기반으로 하며, 방대한 텍스...

#GPT #트랜스포머 #자기 주의 #자연어 처리 #대규모 언어 모델

경사하강법

기술 > 인공지능 > 최적화 알고리즘 | 익명 | 2025-09-02 | 조회수 72

# 경사하강법경사하강법(Graidentcent)은 기계습과 인공지능 분야에서 모델의 학습 과정에서 손실 함수(Loss Function)를 최소화하기 위해 널리 사용되는 **최적화 알고리즘**이다. 이 알고리즘은 주어진 함수의 기울기(경사)를 계산하여, 그 기울기가 가장 가파르게 내려가는 방향으로 매 반복마다 모델의 매개변수를 조정함으로써 최솟값을 찾아가는 ...

#경사하강법 #손실 함수 #학습률 #미니배치 #Adam #모멘텀 #최적화 알고리즘 #기울기 소실 #선형회귀

Apache Spark

기술 > 데이터과학 > 데이터 처리 | 익명 | 2025-09-02 | 조회수 81

# Apache Spark ## 개요 Apache Spark는 대규모 데이터 처리를 위한 오픈소스 분산 컴퓨팅 프레임워크. 2009년 UC 버클리의 AMPLab에서 개발을 시작했으며, 2010년에 오픈소스로 공되고 203년 Apache Software Foundation 인큐베이션 프로젝트로 채택된 이후, 빅데이터 처리 분야에서 가장 널리 사용되는 도구...

#Apache Spark #빅데이터 처리 #RDD #PySpark #분산 컴퓨팅

명목형 범주

기술 > 데이터과학 > 인코딩 | 익명 | 2025-09-02 | 조회수 130

명목형 범 ## 개요**명목형 범주**(inal Category)는 통계학 및 데이터과학에서 범주형 자료(Categorical Data)의 한 유형으로, 서로 구분 가능한 범주를지만 **서로 간 순서나 크기 관계가 없는 데이터를 의미합니다. 명목형주는 단순히 이름(Name) 또는 레이블)에 기반한 분류 제공하며, 수치적인 해이나 대소 비교가가능합니다. ...

#명목형 범주 #원-핫 인코딩 #레이블 인코딩 #타깃 인코딩 #데이터 인코딩

MLP

기술 > 인공지능 > 신경망 모델 | 익명 | 2025-09-02 | 조회수 78

# MLP ## 개요 **MLP**(Multi-Layer Perptron, 다층 퍼셉트론)은 인공신경망(Artificial Neural Network, ANN)의 가장 기본적이고 널리 사용되는 형태 중 하나입니다 단일 퍼셉트론은 선형적으로 분리 가능한 문제만 해결할 수 있지만, MLP는 여러 개의 은닉층(Hidden Layers)을 포함함으로써 **비선...

#MLP #다층 퍼셉트론 #신경망 모델 #역전파 #비선형 활성화 함수

목표 기반 인코딩

기술 > 데이터과학 > 데이터 인코딩 | 익명 | 2025-09-01 | 조회수 83

# 목표 기반 인코딩 목표 기반 인코딩(Target-based Encoding)은 범주형 변수(Categorical Variable)를 수치형 변수로 변환 데이터 인코딩법 중 하나로, 특히 지도 학습(Supervised Learning)에서 목표 변수(Target Variable)와의 관계를 활용하여 인코딩을하는 방법입니다. 이 방은 단순한 레이블 인코딩...

#목표 기반 인코딩 #범주형 변수 인코딩 #평균 인코딩 #데이터 누수 #과적합 방지

Mean Encoding

기술 > 데이터과학 > 인코딩 | 익명 | 2025-09-01 | 조회수 70

Mean Encoding ** Encoding**(평균코딩)은 범주형 변수(Categorical Variable)를 수치형 변수로 변환하는 고 인코딩 기법 중로, 주로 **지도 학습**(Supervised Learning)에서 회귀 또는 분류 문제에 활용됩니다. 이 방법은 범주형 변수의 각 범주(Category)를 그 범주에 해당하는 타겟 변수(Targe...

#Mean Encoding #범주형 변수 인코딩 #지도 학습 #과적합 방지 #피처 엔지니어링

기계학습

기술 > 인공지능 > 머신러닝 | 익명 | 2025-09-01 | 조회수 75

# 기계학습기계학습achine Learning, ML)은 인공능(Artificial Intelligence AI)의 핵심야 중 하나로, 컴퓨터 명시적인 프로그래밍 없이도 데이터를 기반으로 학습하고 경험 통해 성능을 향상시키는 방법을 연구하는 기술입니다. 기계습은 패턴 인식, 예측 분, 의사결정 자동화 등 다양한 응용 분야에서 활용되며, 현대 정보기술의 중심...

#기계학습 #지도 학습 #비지도 학습 #강화 학습 #딥러닝

스무딩 타깃 인코딩

기술 > 데이터과학 > 데이터 정제 | 익명 | 2025-09-01 | 조회수 71

# 스무딩 타깃 인코딩 스무딩 타깃코딩(Smoothing Target Encoding은 범주형 변수를 수치형 변수로 변환하는 **데이터 정제 기법 중 하나로, 특히 **머신러닝 모델의 성능 향상**을 위해 널리 사용된다. 이 기법은 범주형 변수의 각 카테고리에 대해 해당 카테고리가 목표 변수(target variable)에 미치는 영향을 수치로 표현하면서...

#스무딩 타깃 인코딩 #데이터 정제 #범주형 변수 인코딩 #과적합 방지 #Target Encoding #alpha 파라미터 #타깃 리크 방지 #데이터과학 #머신러닝 전처리 #카테고리_encoders

목표 변수

기술 > 데이터과학 > 데이터 전처리 | 익명 | 2025-09-01 | 조회수 81

# 목표 변수 ## 개 **목표 변수**(Target Variable)는 데이터 과학 및 머신러닝 분야에서 모델이 예측하거나 설명하려는 주요 변수를 의미합니다. 이는 종속 변수(Depend Variable), 응답 변수(Response Variable), 또는 출력 변수(Output Variable)라고도 불리며, 모델 학습의 중심이 되는 요소입니다. ...

#목표 변수 #데이터 전처리 #머신러닝 #회귀 문제 #분류 문제

검색 결과