# 박스플롯 개요 **박스플**(Box Plot), 또는 **상자염 그림**(Box-and-Whisker Plot)은의 분포를 시각적으로 표현 통계 그래프의 일종으로 데이터의 중심 경향, 산포도, 왜도, 이상치(Outlier) 등을 한눈에 파악할 있게 해준다. 주로 **데이터 분석**(Data Analysis) 과정에서 데이터의 분포 특성을 탐색하고,...
검색 결과
"IQR"에 대한 검색 결과 (총 13개)
# 데이터셋 구축 ## 개요 데이터셋 구축(Data Set Construction)은 데이터 과학 프로젝트의 첫 번째이자 가장 중요한 단계 중 하나로, 분석, 모델링, 머신러닝 등의 작업을 수행하기 위해 필요한 데이터를 체계적으로 수집, 정제, 통합하고 구조화하는 과정을 의미합니다. 고품질 데이터셋은 정확한 인사이트 도출과 신뢰할 수 있는 예측 모델 개...
# 박스플롯 ## 개요 **박스플**(Box Plot), 또는 **상 수염 그림**(Box-and-isker Plot) 데이터의 분포와 산포도를 시각적으로 표현하는 통 그래프이다. 주로 연속형 데이터 중심 경향, 산포, 왜도, 이상치(outlier) 등을 한눈에 파악할 수 있도록 설계되어 있으며, 특히 여러 그룹 간의 분포를 비교할 때 매우 유용하다. ...
# 데이터 정제 ##요 데이터 정제(Data Cleaning는 데이터 과학 프로세스의 핵 단계 중 하나로,된 원시 데이터 data)에서 오류 중복, 불일치, 결측치, 이상치 등을 식별하고 수정하거나 제거하여 분석에 적합한 고품질의 데이터셋을 만드는 과정을 말합니다. 데이터 정제는 데이터 분석, 기계 학습, 비즈니스 인텔리전스 등의 후속 작업의 정확성과 ...
# 연속형 ## 개요 **연속형**(Continuous type은 데이터과학에서의 측정 방식과 값의 성격에 따라 분류하는 데이터 유형 중 하나로, 특정 구간 내에서 무한히 많은 값을 가질 수 있는 수치 데이터를 의미합니다. 연속형 데이터는 이산형 데이터와 대조되며, 주로 물리적 측정값(예: 길이, 무게, 온도, 시간 등)에서 나타납니다. 이 데이터 유형...
# 박스 플롯 ## 개요 **박스 플롯**(Box Plot), 또는 **상자 수염 그림**(Box-and-Whisker Plot) 데이터의 분포와 산포도를 시각적으로 표현하는 데 사용되는 그래프 유형. 주로 통계 분석과 데이터 시각화에서 데이터의 중심 경향, 변동성, 이상치(Outliers) 등을 한눈에 파악할 수 있도록 도와줍니다. 박스 플롯은 최소값...
# 기계 학습 전처리 기계 학습 전처리(Machine Learning Preprocessing)는 원시 데이터를 기계 학습 모이 효과적으로 학습할 수 있도록 변환하고 준비하는 일련의 과정을 의미합니다. 모델의 성능은 학습 알고리즘뿐 아니라 데이터의 질에 크게 의존하므로, 전처리는 기계 학습 프로젝트에서 가장 중요한 단계 중 하나로 꼽힙니다. 이 문서에서는...
# 이상치 탐지 ## 개요 **이상치지**(Outlier Detection)는 데이터학 및 통계 분석에서 중요한 역할을 하는 기법으로, 데이터 세트 내 다른 관측치와显著하게 다른 값을 가지는 데이터 포인트를 식별하는 과정을 의미한다. 이러한 데이터 포인트는 일반적인 패턴이나 분포에서 벗어나며, 때로는 측정 오류, 데이터 입력 실수, 혹은 진정한 특이 현...
# 데이터 변환 데이터 변환(Data Transformation)은 데이터 과학 및 정보 처리 과정에서 핵심적인 단계 중 하나로, 원시 데이터를 분석이나 모델링에 적합한 형태로 재구조화하거나 변형하는 작업을 의미합니다. 이 과정은 데이터 정제, 통합, 정규화, 스케일링 등 다양한 기법을 포함하며, 데이터 품질을 높이고 분석 결과의 신뢰성을 보장하는 데 중...
# 데이터 전처리 데이터 전처리(Data Preprocessing)는 데이터 과학 및 머신러닝 프로젝트에서 가장 중요한 초기 단계 중 하나로, 원시 데이터(raw data)를 분석이나 모델 학습에 적합한 형태로 변환하는 과정을 의미합니다. 현실 세계의 데이터는 대부분 불완전하고, 일관성이 없으며, 노이즈가 포함되어 있어 그대로 사용하기에는 적합하지 않습니...
# 학습 데이터 ## 개요 **학습 데이터**(Training Data)는 기계학습(Machine Learning) 모델이 특정 과제를 수행할 수 있도록 훈련시키기 위해 사용되는 데이터 세트를 의미합니다. 이 데이터는 모델이 입력과 출력 간의 관계를 학습하고, 새로운 데이터에 대해 예측 또는 분류를 수행할 수 있는 능력을 습득하는 데 핵심적인 역할을 합...
# 필터 ## 개요 필터는 데이터 과학에서 중요한 역할을 하는 기술로, 원치 않는 정보를 제거하거나 특정 조건에 부합하는 데이터만 추출하는 과정을 의미합니다. 이는 데이터 정제, 특성 선택, 신호 처리 등 다양한 분야에서 활용되며, 분석의 정확도와 효율성을 높이는 데 기여합니다. 필터는 단순한 수학적 연산부터 복잡한 머신러닝 모델까지 다양한 형태로 구현됩...
# 노이즈 ## 개요 노이스(Noise)는 데이터 과학에서 **불필요한 변동성** 또는 **측정 오차**를 의미하며, 분석의 정확도와 신뢰성을 저해하는 주요 요소로 작용합니다. 일반적으로 "신호(Signal)"에 포함된 유의미한 정보와 구별되는 **무작위적 요인**으로 간주되며, 데이터 수집 과정에서 발생하는 다양한 외부 영향이나 내부 오류로 인해 나타납...