# 단순 무작위 샘플 ## 개요 **순 무작위 샘플**(Simple Random Sampling SRS)은 통학과 데이터과학에서 사용 가장 기초적이면서도 중요한 샘플링 방법 중 하나입니다. 이 방법은 모단(Population)에서 각 구성이 **동일한 확률**로 표본(Sample)에 포함될 수 있도록 무작위로 선택하는 방식입니다. 단순 무작위 샘플링은 ...
검색 결과
"통계적 추정"에 대한 검색 결과 (총 6개)
# PDF ## 개요 **PDF**(Probability Density Function, 확률 밀도 함수)는 **확론**과 **통계학** 연속 확률 변수의 확률 분포를 설명하는 핵심 개념이다. 이 함수는 특정 값에서 확률 변수가 나타날 **상대적 가능도**를 나타내며, 확률 변수가 특정 구간에 속할 확률을 그 구간에서의 PDF의 적분을 통해 계산할 수 ...
# 샘플링 ## 개요 **샘플링**(Sampling)은 전체 모집단(Population에서 일부를 선택하여 그 특성을 조사함으로써 모집단 성질을 추정하는계적 방법이다. 데이터과학 분야에서 샘플링은규모 데이터셋 효율적으로 처리하고 분석하는 데심적인 역할을 한다. 특히 빅데이터 환경에서 전체 데이터를 처리하는 것이 비용이나 시간 측면에서 비효율적일 경우, ...
# Smoothing ## 개요 **Smoothing**(스무딩)은 데이터 과학 및 통계학에서 잡음(noise)을 줄이고 데이터의 일반적인 패턴이나 추세를 더 명확하게 드러내기 위해 사용되는 기법입니다. 특히 불규칙한 데이터나 불완전한 확률 분포 추정 시, 과적합(overfitting)을 방지하고 보다 일반화된 모델을 만들기 위해 중요하게 활용됩니다. ...
# 스무딩 타깃 인코딩 스무딩 타깃코딩(Smoothing Target Encoding은 범주형 변수를 수치형 변수로 변환하는 **데이터 정제 기법 중 하나로, 특히 **머신러닝 모델의 성능 향상**을 위해 널리 사용된다. 이 기법은 범주형 변수의 각 카테고리에 대해 해당 카테고리가 목표 변수(target variable)에 미치는 영향을 수치로 표현하면서...
# 확률 분포## 개요 **확률 분포**(Probability Distribution는 확률변의 가능한 값들과 각 값이 발생할 확률을 체계적으로 설명하는 수학적 함수이다. 통계학과 확률론의 핵심 개념 중 하나, 데이터의 특과 불확실성을량적으로 분석 예측하는 데 필수적인 도구이다. 확률 분포는 실험, 관측, 또는 이론적 모델에서 얻은 결과의 확률적 행동을 ...