도수

AI
qwen-3-235b-a22b-instruct-2507
작성자
익명
작성일
2025.09.30
조회수
18
버전
v1

도수

개요

도수(度數,)는 통계에서 특정한 값이나 구간이 자료(데이터) 집합 내 얼마나 자주 나타나는지를 나타내는 수치이다 즉, 도수는 어떤 사건이나 범주가 관측된 횟수를 의미하며, 데이터의 분포를 이해하고 분석하는 데 핵심적인 역할을 한다. 도수는 빈도 분포표(frequency distribution table) 작성, 히스토그램(histogram) 생성, 데이터의 경향성 파악 등 다양한 통계적 분석의 기초 자료로 활용된다.

도수는 정성적(범주형) 자료와 정량적(수치형) 자료 모두에 적용할 수 있으며, 자료의 특성에 따라 절대 도수, 상대 도수, 누적 도수 등 다양한 형태로 표현된다.


도수의 종류

1. 절대 도수 (Absolute Frequency)

절대 도수는 특정한 값 또는 구간이 데이터에서 실제로 몇 번 나타났는지를 나타내는 수치이다. 가장 기본적인 도수 형태로, 단순히 등장 횟수를 세는 방식으로 구한다.

예를 들어, 10명의 학생이 시험에서 받은 점수가 다음과 같을 때:

85, 90, 78, 85, 92, 85, 78, 90, 88, 90

  • 점수 85의 절대 도수: 3
  • 점수 90의 절대 도수: 3
  • 점수 78의 절대 도수: 2

이처럼 각 값의 출현 빈도를 직접 기록한 것이 절대 도수이다.

2. 상대 도수 (Relative Frequency)

상대 도수는 전체 관측값 중에서 특정 값이나 구간이 차지하는 비율을 나타낸다. 절대 도수를 전체 데이터 수로 나누어 계산한다.

[ \text{상대 도수} = \frac{\text{절대 도수}}{\text{총 관측값 수}} ]

예로 위의 점수 데이터에서 점수 85의 상대 도수는:

[ \frac{3}{10} = 0.3 \quad \text{또는} \quad 30\% ]

상대 도수는 백분율로 표현되는 경우가 많으며, 서로 다른 크기의 데이터 집합을 비교할 때 유용하다.

3. 누적 도수 (Cumulative Frequency)

누적 도수는 특정 값 이하(또는 이상)의 값들이 전체 데이터에서 얼마나 많이 나타나는지를 누적하여 나타낸 수치이다. 주로 정렬된 순서(오름차순 또는 내림차순)로 계산된다.

예를 들어, 점수를 오름차순으로 정렬하고 누적 도수를 계산하면 다음과 같다:

점수 절대 도수 누적 도수
78 2 2
85 3 5
88 1 6
90 3 9
92 1 10

이 표에서 점수 85 이하의 누적 도수는 5이며, 이는 전체 10명 중 5명이 85점 이하의 점수를 받았음을 의미한다.


도수 분포표

도수 분포표는 데이터를 일정한 구간(계급)으로 나누고 각 구간에 속하는 도수를 정리한 표이다. 특히 연속형 수치 자료를 다룰 때 유용하다.

예: 30명의 학생의 키 데이터 (단위: cm)

계급 구간 (cm) 도수
150–159 5
160–169 12
170–179 8
180–189 4
190–199 1

이 표를 통해 데이터의 분포 양상을 직관적으로 파악할 수 있으며, 이후 히스토그램이나 누적 도수 곡선(cumulative frequency curve) 등의 그래프 작성을 위한 기초 자료가 된다.


도수의 통계적 활용

도수는 다음과 같은 다양한 통계 분석에 활용된다:

  • 데이터 시각화: 히스토그램, 원 그래프(pie chart), 막대 그래프(bar chart) 등은 도수를 기반으로 생성된다.
  • 중심 경향성 분석: 최빈값(mode)은 가장 도수가 높은 값을 의미하며, 평균과 중앙값과 함께 중심 경향성을 설명하는 지표다.
  • 분포 형태 분석: 도수 분포를 통해 자료가 정규분포, 왜도(skewness), 첨도(kurtosis) 등을 파악할 수 있다.
  • 예비 분석 (Exploratory Data Analysis, EDA): 도수 분석은 데이터의 특성을 파악하고 이상치(outlier)를 탐지하는 데 중요한 첫 단계이다.

참고 자료 및 관련 문서

  • 빈도 분포 (Frequency Distribution): 도수를 기반으로 자료를 체계적으로 정리하는 방법.
  • 히스토그램 (Histogram): 도수를 시각화한 막대 그래프.
  • 정규분포 (Normal Distribution): 대칭적인 도수 분포 형태.
  • 통계학 개론 (저자: 김태형 등), 한국방송통신대학교 출판부
  • Introduction to the Practice of Statistics (David S. Moore, George P. McCabe)

도수는 통계 분석의 첫걸음이자 가장 중요한 개념 중 하나로, 데이터의 본질을 이해하는 데 없어서는 안 될 요소이다. 정확한 도수 산출과 해석은 이후 모든 분석의 신뢰성을 좌우한다.

AI 생성 콘텐츠 안내

이 문서는 AI 모델(qwen-3-235b-a22b-instruct-2507)에 의해 생성된 콘텐츠입니다.

주의사항: AI가 생성한 내용은 부정확하거나 편향된 정보를 포함할 수 있습니다. 중요한 결정을 내리기 전에 반드시 신뢰할 수 있는 출처를 통해 정보를 확인하시기 바랍니다.

이 AI 생성 콘텐츠가 도움이 되었나요?