도수
도수
개요
도수(度數,)는 통계에서 특정한 값이나 구간이 자료(데이터) 집합 내 얼마나 자주 나타나는지를 나타내는 수치이다 즉, 도수는 어떤 사건이나 범주가 관측된 횟수를 의미하며, 데이터의 분포를 이해하고 분석하는 데 핵심적인 역할을 한다. 도수는 빈도 분포표(frequency distribution table) 작성, 히스토그램(histogram) 생성, 데이터의 경향성 파악 등 다양한 통계적 분석의 기초 자료로 활용된다.
도수는 정성적(범주형) 자료와 정량적(수치형) 자료 모두에 적용할 수 있으며, 자료의 특성에 따라 절대 도수, 상대 도수, 누적 도수 등 다양한 형태로 표현된다.
도수의 종류
1. 절대 도수 (Absolute Frequency)
절대 도수는 특정한 값 또는 구간이 데이터에서 실제로 몇 번 나타났는지를 나타내는 수치이다. 가장 기본적인 도수 형태로, 단순히 등장 횟수를 세는 방식으로 구한다.
예를 들어, 10명의 학생이 시험에서 받은 점수가 다음과 같을 때:
85, 90, 78, 85, 92, 85, 78, 90, 88, 90
- 점수 85의 절대 도수: 3
- 점수 90의 절대 도수: 3
- 점수 78의 절대 도수: 2
이처럼 각 값의 출현 빈도를 직접 기록한 것이 절대 도수이다.
2. 상대 도수 (Relative Frequency)
상대 도수는 전체 관측값 중에서 특정 값이나 구간이 차지하는 비율을 나타낸다. 절대 도수를 전체 데이터 수로 나누어 계산한다.
[ \text{상대 도수} = \frac{\text{절대 도수}}{\text{총 관측값 수}} ]
예로 위의 점수 데이터에서 점수 85의 상대 도수는:
[ \frac{3}{10} = 0.3 \quad \text{또는} \quad 30\% ]
상대 도수는 백분율로 표현되는 경우가 많으며, 서로 다른 크기의 데이터 집합을 비교할 때 유용하다.
3. 누적 도수 (Cumulative Frequency)
누적 도수는 특정 값 이하(또는 이상)의 값들이 전체 데이터에서 얼마나 많이 나타나는지를 누적하여 나타낸 수치이다. 주로 정렬된 순서(오름차순 또는 내림차순)로 계산된다.
예를 들어, 점수를 오름차순으로 정렬하고 누적 도수를 계산하면 다음과 같다:
| 점수 | 절대 도수 | 누적 도수 |
|---|---|---|
| 78 | 2 | 2 |
| 85 | 3 | 5 |
| 88 | 1 | 6 |
| 90 | 3 | 9 |
| 92 | 1 | 10 |
이 표에서 점수 85 이하의 누적 도수는 5이며, 이는 전체 10명 중 5명이 85점 이하의 점수를 받았음을 의미한다.
도수 분포표
도수 분포표는 데이터를 일정한 구간(계급)으로 나누고 각 구간에 속하는 도수를 정리한 표이다. 특히 연속형 수치 자료를 다룰 때 유용하다.
예: 30명의 학생의 키 데이터 (단위: cm)
| 계급 구간 (cm) | 도수 |
|---|---|
| 150–159 | 5 |
| 160–169 | 12 |
| 170–179 | 8 |
| 180–189 | 4 |
| 190–199 | 1 |
이 표를 통해 데이터의 분포 양상을 직관적으로 파악할 수 있으며, 이후 히스토그램이나 누적 도수 곡선(cumulative frequency curve) 등의 그래프 작성을 위한 기초 자료가 된다.
도수의 통계적 활용
도수는 다음과 같은 다양한 통계 분석에 활용된다:
- 데이터 시각화: 히스토그램, 원 그래프(pie chart), 막대 그래프(bar chart) 등은 도수를 기반으로 생성된다.
- 중심 경향성 분석: 최빈값(mode)은 가장 도수가 높은 값을 의미하며, 평균과 중앙값과 함께 중심 경향성을 설명하는 지표다.
- 분포 형태 분석: 도수 분포를 통해 자료가 정규분포, 왜도(skewness), 첨도(kurtosis) 등을 파악할 수 있다.
- 예비 분석 (Exploratory Data Analysis, EDA): 도수 분석은 데이터의 특성을 파악하고 이상치(outlier)를 탐지하는 데 중요한 첫 단계이다.
참고 자료 및 관련 문서
- 빈도 분포 (Frequency Distribution): 도수를 기반으로 자료를 체계적으로 정리하는 방법.
- 히스토그램 (Histogram): 도수를 시각화한 막대 그래프.
- 정규분포 (Normal Distribution): 대칭적인 도수 분포 형태.
- 통계학 개론 (저자: 김태형 등), 한국방송통신대학교 출판부
- Introduction to the Practice of Statistics (David S. Moore, George P. McCabe)
도수는 통계 분석의 첫걸음이자 가장 중요한 개념 중 하나로, 데이터의 본질을 이해하는 데 없어서는 안 될 요소이다. 정확한 도수 산출과 해석은 이후 모든 분석의 신뢰성을 좌우한다.
이 문서는 AI 모델(qwen-3-235b-a22b-instruct-2507)에 의해 생성된 콘텐츠입니다.
주의사항: AI가 생성한 내용은 부정확하거나 편향된 정보를 포함할 수 있습니다. 중요한 결정을 내리기 전에 반드시 신뢰할 수 있는 출처를 통해 정보를 확인하시기 바랍니다.