# train_size ## 개요 `train_size`는 머신러닝 및 데이터 과학 분야에서 모델 학습을 위한 데이터 분할 과정에서 사용되는 **하이퍼파라미터** 중 하나로, 전체 데이터셋 중 **학습 데이터**(training set)로 사용할 비율 또는 개수를 지정하는 파라미터입니다. 이 파라미터는 모델의 학습 성능과 일반화 능력에 직접적인 영향을 ...
검색 결과
"모델 성능 평가"에 대한 검색 결과 (총 7개)
Rasa Documentation ## 개요 **Rasa Documentation**은 오픈소 대화형 AI 플랫폼인 [Rasa](https://rasa.com)의 공식 문서를 총칭하는 백서 형태의 기술문서입니다. Rasa는 사용자 정의 챗봇과 음성 어시스턴트를 구축하기 위한 프레임워크로, 자연어 이해(NLU), 대화 관리(Dialogue Manageme...
# 교차 검증 ## 개요 **교차 검**(Cross-Validation, CV) 기계학습 통계 모델의 성능을가하고 과적(overfitting) 방지하기 위해 사용되는 기법입니다. 모델이 훈련 데이터만 잘 맞추어져 새로운 데이터에 대해서는 성능이 저하되는 문제를 사전에 검출하기 위해, 데이터를 여러 번 나누어 학습과 검증을 반복하는 방식으로 작동합니다. ...
명목형 범 ## 개요**명목형 범주**(inal Category)는 통계학 및 데이터과학에서 범주형 자료(Categorical Data)의 한 유형으로, 서로 구분 가능한 범주를지만 **서로 간 순서나 크기 관계가 없는 데이터를 의미합니다. 명목형주는 단순히 이름(Name) 또는 레이블)에 기반한 분류 제공하며, 수치적인 해이나 대소 비교가가능합니다. ...
# 결정 계수 (R-squared) ## 개요 결정 계수(R-squared)는 통계학에서 회귀 모델의 설명력(예측 능력)을 측정하는 주요 지표로, 종속 변수의 변동성 중 독립 변수에 의해 설명되는 비율을 나타냅니다. 0~1 사이의 값을 가지며, 값이 클수록 모델이 데이터를 더 잘 설명한다고 해석됩니다. 결정 계수는 회귀 분석에서 모델 적합도 평가에 널리 ...
# 분류 (Classification) ## 개요 분류(Classification)는 데이터과학에서 가장 핵심적인 기계학습(ML) 기법 중 하나로, 주어진 데이터를 사전 정의된 범주 또는 클래스에 할당하는 과정을 의미합니다. 이는 **지도학습(Supervised Learning)**의 대표적 유형으로, 입력 데이터(X)와 그에 해당하는 레이블(Y)을 기반...
# MAE ## 개요 **MAE**(Mean Absolute Error, 평균 절대 오차)는 회귀(regression) 문제에서 예측값과 실제값 사이의 오차를 평가하는 대표적인 지표 중 하나입니다. 인공지능 모델, 특히 회귀 모델의 성능을 측정할 때 널리 사용되며, 오차의 절대값을 평균하여 계산하므로 해석이 직관적이고 이해하기 쉬운 장점이 있습니다. ...