# Box plot ## 개요 **박스 플롯**(Box plot), 또는 **상자 수염 그림**(box-and-whisker plot)은 데이터의 분포를 시각적으로 표현하는 통계 그래프의 일종입니다. 이 그래프는 데이터의 중심 경향, 산포도, 왜도, 이상치(outlier) 등을 한눈에 파악할 수 있게 해주며, 특히 여러 그룹 간의 분포를 비교할 때 매우...
검색 결과
"통계량"에 대한 검색 결과 (총 48개)
# 양측 검정 ## 개요 **양측 검정**(two-tailed test)은 통계학에서 가설 검정의 한 형태로, 모수(parameter)가 특정 값과 **다르다**(≠)는 것을 검정하고자 할 때 사용된다. 즉, 관심 있는 모수(예: 모평균, 모비율 등)가 기준값보다 **크거나 작을 가능성 모두**를 고려하여 귀무가설을 기각할지를 판단하는 방법이다. 이는 ...
# 기각역 ## 개요 **기각역**(rejection region)은 통계학에서 **가설 검정**(hypothesis testing)의 핵심 개념 중 하나로, 귀무가설($H_0$)을 기각할지를 결정하는 기준을 수학적으로 정의한 영역을 의미한다. 즉, 표본에서 계산된 검정통계량(test statistic)이 이 영역에 속할 경우, 귀무가설을 기각하고 대립...
# 귀무가설 ## 개요 **귀무가설**(Null Hypothesis)은 통계학에서 가설 검정의 출발점이 되는 기본적인 가설로, 일반적으로 "효과가 없다", "차이가 없다", "상관이 없다"는 주장을 담고 있다. 기호로는 보통 **H₀** (H-zero 또는 H-nought)로 표기하며, 연구자가 검정을 통해 기각하거나 기각하지 못할 가능성을 가진 가설이...
# 비표준화 베타계수 ## 개요 **비표준화 베타계수**(Unstandardized Beta Coefficient)는 회귀분석에서 독립변수(설명변수)가 종속변수(반응변수)에 미치는 영향의 크기를 나타내는 통계량 중 하나로, 변수들의 원래 측정 단위를 유지한 상태에서 추정된 회귀계수를 의미한다. 일반적으로 회귀분석 결과 출력 시 **B** 또는 **β**...
# 서열 ## 개요 **서열**(序列表記, Ordinal Scale)은 통계학에서 자료의 측정 수준(measurement level) 중 하나로, 데이터가 자연스러운 순서를 가지지만 그 간격이 일정하지 않은 경우에 사용되는 척도를 의미한다. 서열 척도는 **명목 척도**(Nominal Scale)보다 높은 수준의 측정 척도이며, **간격 척도**(Int...
# 회귀 계수 회귀 계수(Regression Coefficient)는 회귀분석에서 독립변수(설명변수가 종속변(반응변수에 미치는 영향의 크기와 방을 나타내는 통계량이다. 회귀 계수는귀 모형의심 요소로, 데이터 기반으로 변수 간의 관계를 정량적으로 해석하고 예측하는 데 핵심적인 역할을 한다. 본 문서에서는 회귀 계수의 정의, 종류, 해석 방법, 추정 방식, ...
# 지수분포 지수분(**Exponential Distribution**) 통계학과률론에서 연속 확률분포 일종으로, 간의 **시간 간격**을 모델링하는 데 널리됩니다. 특히,아송 과정(Pson process)에서하는 사건 사이의 시간을 설명하는 적합한 분포로,뢰성 공학, 생존 분석, 대기 이론(Queueing theory) 등 다양한 응용 분야에서 중요한 ...
# Brant Test ## 개요 **Brant Test**(브란트 검)는 통계에서 다항 로지틱 회귀 모델(Multinomial Logistic Regression)의 **비례 오즈 가정**(Proportional Odds Assumption)을 검정하기 위한 통계적 방법이다. 이 검정은 다항 로지스틱 회귀 모델을 사용할 때 독립 변수들이 종속 변수의 ...
# ROC 곡선 ## 개요 ROC 곡선(Receiver Operatingistic Curve, 수기 운영 특성 곡선)은 이진류 모델의 성능을각적으로 평가하고 비교하는 데 사용되는 중요한 도입니다. ROC 곡선은 다양한 분류 임계값(threshold)에 **민감도**(감지율, 재현율)와 **위양성율**(거짓 양성 비율)을 비교하여 모델의 판별 능력을 분석...
# 설명변수의 분산## 개요 회귀분석(Regression Analysis)은 종속변수(dependent variable)와 이상의 독립변수(independent variable) 간의 관계를 모델링하고 분석하는 통계적 기법이다. 이 과정에서 독립변수는 일반적으로 **설명변수**(explanatory variable) 또는 **예측변수**(predictor...
# 지수족 형태 지수족(Exponential Family Form)는 통계학에서 중요한 확률분의 수학적 구로, 많은 일반적인 확률분포들이 이 형태로 표현될 수 있다. 지수족은 추정 이론, 베이즈 통계, 일반화선형모형(GLM), 정보 이론 등 다양한 통계적 분석에서 핵심적인 역할을 하며, 수학적 처리의 용이성과 이론적 아름다움을 동시에 갖춘 구조이다. 본 ...
Adjusted R-s ## 개요**Adjusted R-squared수정된 결정계수)는귀분석에서 모의 적합도를 평가하는 지표 중 하나로, 일반적인 **R-squared**(결계수)의계를 보완하기 위해 제안된 통계량이다. R-squared 독립변수들이 종속변수를 잘 설명하는지를 나타내는 값이지만, 독립변수를 추가할수록 무조건 증가하는 성향이 있어 모델의 과...
# 데이터 정제 ##요 데이터 정제(Data Cleaning는 데이터 과학 프로세스의 핵 단계 중 하나로,된 원시 데이터 data)에서 오류 중복, 불일치, 결측치, 이상치 등을 식별하고 수정하거나 제거하여 분석에 적합한 고품질의 데이터셋을 만드는 과정을 말합니다. 데이터 정제는 데이터 분석, 기계 학습, 비즈니스 인텔리전스 등의 후속 작업의 정확성과 ...
# 연속형 ## 개요 **연속형**(Continuous type은 데이터과학에서의 측정 방식과 값의 성격에 따라 분류하는 데이터 유형 중 하나로, 특정 구간 내에서 무한히 많은 값을 가질 수 있는 수치 데이터를 의미합니다. 연속형 데이터는 이산형 데이터와 대조되며, 주로 물리적 측정값(예: 길이, 무게, 온도, 시간 등)에서 나타납니다. 이 데이터 유형...
# 배치 정규화 개요 **배치 정규화**(Batch Normalization, 이하 배치정규화)는 딥러닝 모델의 학습 속도를 향상시키고, 학습 과정을 안정화하기 위해 제안된 기술이다. 2015년 세르게이 이고르(Sergey Ioffe)와 크리스티안 슈미트(CChristian Szegedy)가 발표한 논문 *"Batch Normalization: Acc...
명목형 범 ## 개요**명목형 범주**(inal Category)는 통계학 및 데이터과학에서 범주형 자료(Categorical Data)의 한 유형으로, 서로 구분 가능한 범주를지만 **서로 간 순서나 크기 관계가 없는 데이터를 의미합니다. 명목형주는 단순히 이름(Name) 또는 레이블)에 기반한 분류 제공하며, 수치적인 해이나 대소 비교가가능합니다. ...
SciPy ## 개요 **SciPy**(Science Python) 과학적 계산 및 수치석을 위한 파썬의 핵심 라이러리 중 하나로, NumPy를 기반으로 하여 고급 수학적 알고리즘과 수치적 기법을 제공합니다. 데이터 과학, 공학, 물리학, 통계학 등 다양한 분야에서 복잡한 계산을 효율적으로 수행할 수 있도록 설계되어 있으며, 오픈소스 프로젝트로 개발자 ...
# 목표 기반 인코딩 목표 기반 인코딩(Target-based Encoding)은 범주형 변수(Categorical Variable)를 수치형 변수로 변환 데이터 인코딩법 중 하나로, 특히 지도 학습(Supervised Learning)에서 목표 변수(Target Variable)와의 관계를 활용하여 인코딩을하는 방법입니다. 이 방은 단순한 레이블 인코딩...
# 박스 플롯 ## 개요 **박스 플롯**(Box Plot), 또는 **상자 수염 그림**(Box-and-Whisker Plot) 데이터의 분포와 산포도를 시각적으로 표현하는 데 사용되는 그래프 유형. 주로 통계 분석과 데이터 시각화에서 데이터의 중심 경향, 변동성, 이상치(Outliers) 등을 한눈에 파악할 수 있도록 도와줍니다. 박스 플롯은 최소값...