위키너와나

ROC 곡선

기술 > 데이터과학 > 모델 평가 | 익명 | 2025-09-27 | 조회수 66

# ROC 곡선 ## 개요 ROC 곡선(Receiver Operatingistic Curve, 수기 운영 특성 곡선)은 이진류 모델의 성능을각적으로 평가하고 비교하는 데 사용되는 중요한 도입니다. ROC 곡선은 다양한 분류 임계값(threshold)에 **민감도**(감지율, 재현율)와 **위양성율**(거짓 양성 비율)을 비교하여 모델의 판별 능력을 분석...

#ROC 곡선 #AUC #이진 분류 #모델 평가 #민감도 #위양성율 #scikit-learn

FP

기술 > 데이터과학 > 혼동 행렬 | 익명 | 2025-09-27 | 조회수 58

FP **FP**(False Positive, 위양성)는 데이터, 특히 머신러닝과 통계 분석에서 중요한 개념 중 하나로, **모델이 실제로는 부정 클래스**(Negative) **인 사례를 잘못되어 양성 클래스**(Positive) **로 예측한 경우**를 의미합니다. 혼동 행렬(Confusion Matrix)에서 FP는 모델의 오분류 오류를 나타내는 네...

#FP #혼동 행렬 #정밀도 #성능 지표 #이진 분류

회귀

기술 > 머신러닝 > 회귀 분석 | 익명 | 2025-09-27 | 조회수 63

# 회귀 회귀(Regression)는 머신러닝 통계학에서 기법 중 하나로 하나 이상의 독립 변수(입력 변수)와 종속 변수(출력 변수) 사이의 관계를 모델링하여 연속 값을 예측하는 데 사용됩니다. 회귀 분석은 데이터의 패턴을 이해하고, 미래의 값을 추정하거나 간의 인과 관계를 탐색하는 데 널리 활용됩니다. 이 문서에서는 회귀 분석의 기본 개념, 주요 유형,...

#회귀 분석 #선형 회귀 #정규화 #모델 평가 #지도 학습

Forecasting: Principles and Practice

출판 > 학술 자료 > 데이터과학 서적 | 익명 | 2025-09-27 | 조회수 73

# Forecasting: Principles and Practice ## 개요 **Forecasting: Principles and**(이하 F)는 예측 분석의 기에서 고급 기법까지를 체계적으로 다루는 대적인 데이터과학 서적 중 하나로, 특히 시계열 예측(Time Series Forecasting) 분야에서 널리 활용되는 오픈 액세스(Open Acce...

#시계열 예측 #R 프로그래밍 #ETS 모델 #ARIMA #데이터과학 서적

시계열 예측

기술 > 데이터과학 > 예측 분석 | 익명 | 2025-09-26 | 조회수 61

# 시계열 예측 ## 개요 **시계열 예측**(Time Series Forecasting)은 시간에 따라 순차적으로 수집된 데이터를 기반으로 미래의 값을 예하는 데이터 과학의 핵심법 중 하나입니다. 이법은 경제표, 주가,상 데이터, 판매량 웹 트래픽 등 시간의 흐름에 따라 변화하는 다양한 현상에 적용되며, 기업의 전략 수립, 자원 배분, 리스크 관리 등...

#시계열 예측 #ARIMA #LSTM #지수 평활법 #Prophet

Adjusted R-squared

과학 > 통계학 > 회귀분석 | 익명 | 2025-09-16 | 조회수 95

Adjusted R-s ## 개요**Adjusted R-squared수정된 결정계수)는귀분석에서 모의 적합도를 평가하는 지표 중 하나로, 일반적인 **R-squared**(결계수)의계를 보완하기 위해 제안된 통계량이다. R-squared 독립변수들이 종속변수를 잘 설명하는지를 나타내는 값이지만, 독립변수를 추가할수록 무조건 증가하는 성향이 있어 모델의 과...

#Adjusted R-squared #회귀분석 #모델 선택 #과적합 방지 #다중회귀분석 #통계 지표 #Python #statsmodels #중급

인공지능

기술 > 인공지능 > 머신러닝 | 익명 | 2025-09-16 | 조회수 53

# 인공지능 ## 개요 **인공지능Artificial Intelligence, AI)은 인간의 지능을 모방하거나 이를월하는 기계적 시스템을 설계하고 구현하는 컴퓨터 과학의 한 분입니다. 인공지능은 인간이 보이는 사고, 학습, 추론, 인식, 문제 해결, 의사 결정 등의 능력을 소프트웨어나 하드웨어를 통해 재현하는 것을 목표로 합니다. 최근 수십 년간 컴퓨...

#인공지능 #머신러닝 #딥러닝 #AI 윤리 #지도 학습 #비지도 학습 #강화 학습

VC 이론

기술 > 인공지능 > 머신러닝 | 익명 | 2025-09-15 | 조회수 80

# VC 이론 VC 이론(Vapnik-Chervonenkis Theory)은 통계적 학습 이론의 핵심 기반 중 하나로, 머신러닝 모델의 일반화 능력을 수학적으로 분석하는 데 중요한 역할을. 이 이론 블라드미르 바프니크(Vladimir Vapnik)와 알세이 체르보넨키스lexey Chervonenkis가 190년대 초반에 제안하였으며, 특히 **모델의 복잡...

#VC 이론 #VC 차원 #일반화 오차 #모델 복잡도 #SVM #학습 가능성 #통계적 학습 이론

MSE

기술 > 인공지능 > 모델 평가 | 익명 | 2025-09-15 | 조회수 103

# MSE ## 개요 **MSE**(Mean Squared Error, 평균 제곱 오차)는 회귀(regression) 문제에서 예측 모델의 성능을 평가하는 데 널리 사용되는 지표입니다. 이는 예측과 실제 관측값 사이의 차이(오차)를 제곱한 후, 그 평균을 계산함으로써 모델의 정확도를 수치화합니다. MSE는 인공지능, 특히 머신러닝 및 딥러닝 모델의 학습...

#MSE #회귀 평가 지표 #손실 함수 #이상치 민감도 #초급

최적의 경계선

기술 > 인공지능 > 머신러닝 | 익명 | 2025-09-10 | 조회수 66

# 최적의 경계선 ## 개요 **최적 경계선**(Optimal Decision)은 머신러닝, 지도 학습(Supervised Learning)에서 분류(Classification) 문제 해결할 때 사용 핵심 개념 중 하나. 이는 서로 다른 클래스에 속한 데이터 포인트들을 가장 잘 구분할 수 있는 기하학적 경계를 의미합니다. 최적의 경계선은 모델이 새로운 ...

#최적 경계선 #서포트 벡터 머신 #결정 경계 #지도 학습 #마진 최대화

성능 평가

기술 > 인공지능 > 모델 평가 | 익명 | 2025-09-09 | 조회수 103

# 성능 평가 인공지능(AI) 모델의 **성능 평가Performance Evaluation)는 개발된 모델이 주어진 과제(Task)를 얼마나 정확하고 신뢰성 있게 수행하는지를 정량적·정성적으로 분석하는 과정입니다. 모델의 훈련 과정 이후, 성능 평가는 모델의 실용성과 신뢰성을 판단하는 핵심 단계로, 실제 배포 전 반드시 수행되어야 합니다. 특히 머신러닝 ...

#성능 평가 #평가 지표 #교차 검증 #데이터 불균형 #과적합

순서형 범주

기술 > 데이터과학 > 인코딩 | 익명 | 2025-09-02 | 조회수 68

# 순서형 범주 ## 개요 **순서형 범주**(Ordinal Category)는 범주형 데이터의 한류로, 특정한 순서나 등급이 존재하는 범주를 의미합니다. 데이터 과학과 통계 분석에서 데이터는 일반적으로 **정량형**(수치형)과 **정성형**(범주형)으로 나뉘며, 정성형 데이터는 다시 **명목형 범주**(Nominal Category)와 **순서형 범주...

#순서형 범주 #데이터 인코딩 #서열 정보 #데이터과학 #Ordinal Encoding

테스트 데이터

기술 > 데이터과학 > 데이터 분할 | 익명 | 2025-09-02 | 조회수 105

테스트 데이터 개요 **스트 데이터**(Test Data는 데이터 과학 및 기계 학습 프로젝트에서 모델의능을 평가하기 위해 사용되는 데이터의 하 집합입니다.적으로 전체 데이터셋은 훈련(Training), 검증(Validation), 테스트(Test) 데이터로 분할되며, 이 중 **테 데이터**는 모델발 과정에서 **최종 평가 단**에서 사용됩니다 테스...

#테스트 데이터 #데이터 분할 #과적합 진단 #층화 샘플링 #시계열 분할

scikit-learn

기술 > 인공지능 > 머신러닝 | 익명 | 2025-08-31 | 조회수 150

# scikit-learn **scikit-learn**은 파이썬 기반의 오픈소스 머신러닝 라이브러리로, 데이터 분석과 머신러닝 모델 개발을 위한 다양한 알고리즘과 도구를 제공합니다. 간결한 API와 뛰어난 문서화로 인해 초보자부터 전문가까지 널리 사용되며, 데이터 과학 및 인공지능 분야에서 사실상 표준 라이브러리로 자리 잡고 있습니다. scikit-le...

#scikit-learn #머신러닝 #파이썬 #감독 학습 #비감독 학습 #데이터 전처리 #모델 평가 #Random Forest #PCA #초급

미세조정

기술 > 인공지능 > 머신러닝 | 익명 | 2025-07-30 | 조회수 76

# 미세조정 ## 개요 **미세조정**(Fine-tuning)은 사전 훈련된 머신러닝 모델을 특정 작업이나 도메인에 맞게 세부적으로 조정하는 기법입니다. 일반적으로 대규모 데이터셋으로 훈련된 모델(예: ImageNet, BERT)을 기반으로 하여, 새로운 작업에 필요한 작은 데이터셋으로 추가 훈련을 진행합니다. 이는 **전이 학습**(Transfer Le...

#미세조정 #전이 학습 #BERT #PyTorch #특징 추출 #학습률 조절 #컴퓨터 비전 #자연어 처리 #중급

시계열 데이터 포인트

기술 > 데이터과학 > 분석 | 익명 | 2025-07-13 | 조회수 95

# 시계열 데이터 포인트 ## 개요/소개 시계열 데이터 포인트는 특정 시간에 대한 측정값을 나타내는 데이터의 단위입니다. 이는 시간에 따라 변화하는 현상을 분석하기 위해 사용되며, 금융, 기상, 의료 등 다양한 분야에서 중요한 역할을 합니다. 시계열 데이터 포인트는 순서를 가지며, 시간 간격이 일정하거나 불규칙할 수 있습니다. 본 문서에서는 시계열 데...

#시계열 데이터 포인트 #ARIMA #LSTM #이동 평균 #Python pandas #statsmodels #TensorFlow #금융 응용 #기상 분석 #의료 모니터링

탐색과 활용

기술 > 인공지능 > 머신러닝 | 익명 | 2025-07-11 | 조회수 91

# 탐색과 활용 ## 개요 **탐색과 활용**(Exploration and Exploitation)은 인공지능(AI) 및 머신러닝(ML) 분야에서 모델의 성능 향상과 최적화를 위해 중요한 개념이다. 이는 **탐색**(exploration)과 **활용**(exploitation)의 균형을 맞추며, 탐색은 새로운 데이터나 파라미터를 탐구하는 과정이고,...

#탐색과 활용 #하이퍼파라미터 튜닝 #베이지안 최적화 #AutoML #과적합 #ε-greedy #UCB #Scikit-learn #Optuna

지도학습

기술 > 인공지능 > 머신러닝 | 익명 | 2025-07-11 | 조회수 111

# 지도학습 ## 개요 지도학습(Supervised Learning)은 인공지능(AI) 분야에서 가장 널리 사용되는 머신러닝(Machine Learning) 기법 중 하나로, **라벨이 붙은 데이터**를 통해 모델을 학습시키는 방식이다. 이 방법은 입력 데이터와 그에 대응하는 정답(레이블)을 이용해 패턴을 인식하고, 새로운 데이터에 대한 예측을 수행한다....

#지도학습 #분류 #회귀 #과적합 #데이터 전처리 #평가 지표 #scikit-learn #선형 회귀 #의사결정나무

scikit-learn

기술 > 소프트웨어 > 오픈소스 | 익명 | 2025-07-11 | 조회수 164

# scikit-learn ## 개요 scikit-learn은 파이썬 프로그래밍 언어를 기반으로 한 **오픈소스 머신러닝 라이브러리**입니다. 과학적 컴퓨팅과 데이터 분석을 위한 Python 생태계(SciPy)에 포함되어 있으며, **데이터 마이닝**, **데이터 분석**, **예측 모델링** 등 다양한 기능을 제공합니다. 2007년에 처음 공개된...

#scikit-learn #machine learning library #Python programming #BSD license #supervised learning #unsupervised learning #data preprocessing #model evaluation #data science education

검색 결과