# 도수 ## 개요 도수(度數,)는 통계에서 특정한 값이나 구간이 자료(데이터) 집합 내 얼마나 자주 나타나는지를 나타내는 수치이다 즉, 도수는 어떤 사건이나 범주가 관측된 횟수를 의미하며, 데이터의 분포를 이해하고 분석하는 데 핵심적인 역할을 한다. 도수는 빈도 분포표(frequency distribution table) 작성, 히스토그램(histog...
검색 결과
"도수"에 대한 검색 결과 (총 5개)
# 히스토그램 ## 개요 히스토그(Histogram)은 통계학 연속형 또는산형 수치 데이터 분포를 시각적으로 표현하는 대적인 그래프 도구이다. 데이터를 일정한 구간(빈, bin)으로 나누고, 각 구간 속하는 데이터의 빈도수(frequency) 또는 상대 빈도수(relative frequency)를 막대의 높이로 나타낸다. 히스토그램은 데이터의 중심 경향...
# TF-IDF ## 개요 TF-IDF(Term Frequency-Inverse Document Frequency)는어처리(NLP) 분야에서 텍스트 데이터의 중요도를 수치화 대표적인 통계적 측정 기법입니다. 이 방법은 특정 단어가 하나의 문서 내에서 얼마나 자주 등장하는지(빈도)와 동시에 전체 문서 집합(corpus) 내에서 그 단어가 얼마나 희소하게 ...
히스토그램 ## 개요 히스토그램(Histogram)은 **연속형 데이터**(또는 구간이 있는 이산형 데이터)의 분포를 시각적으로 표현하는 그래프 유형 중 하나로, 데이터가 특정 구간(빈, bin)에 얼마나 많이 분포되어 있는지를 막대 그래프 형태로 보여줍니다. 히스토그램은 데이터의 중심 경향, 산포도, 왜도, 이상치 등을 파악하는 데 매우 유용하며, 통...
범주형 변수## 개요 범주형 변수(**Categorical Variable**)는 데이터 분석에서 중요한 데이터 유형 중 하나로, 관측값이 특정 **범주**(category) 또는 **그룹**에 속하는지를 나타내는 변수입니다. 이 변수는 수치적 의미보다는 **질적**(qualitative) 성격을 가지며, 데이터를 분류하거나 그룹화하는 데 사용됩니다. 예...