# 수치 예측 문제 (Numerical Prediction Problem) ## 개요 수치 예측 문제는 머신러닝에서 입력 데이터의 특징을 바탕으로 연속적인 실수 값(continuous value)을 출력하는 지도 학습(Supervised Learning) 태스크입니다. 이 분야는 통계학의 **회귀 분석(Regression Analysis)**에 이론적 뿌...
검색 결과
"평가 지표"에 대한 검색 결과 (총 99개)
# CheXNet ## 개요 **CheXNet**은 딥러닝 기반의 의료 영상 분석 모델로, 흉부 X-선 이미지에서 흉부 질환을 탐지하는 데 특화되어 개발된 인공의 연구팀이 2017년에 발표한 이 모델은 의료 인공지능 분야에서 중요한 이정표로 평가, 방사선 전문의 수준의 성능을 달성했다는 점에서 주목을 받았습니다. CheXNet은 대규모 공개 흉부 X-선...
# FWER ## 개요 **FWER**(Family-Wise Error Rate, 족별 오류율)은 다중 가설 검정(multiple hypothesis testing)에서 중요한 개념으로, **적어도 하나의 귀무가설을 잘못 기각할 확률**, 즉 **적어도 하나의 제1종 오류(Type I error)를 범할 확률**을 의미합니다. 단일 가설 검정에서는 제1...
# 정밀도 정밀도(Precision)는 인공지능, 특히 머신러닝 모델의 성능을 평가하는 핵심 지표 중 하나로, **모델이 긍정으로 예측한 샘플 중 실제로 긍정인 비율**을 의미합니다. 주로 분류 문제, 특히 이진 분류(Binary Classification)에서 사용되며, 모델의 예측 결과가 얼마나 신뢰할 수 있는지를 판단하는 데 중요한 역할을 합니다. ...
# F1 score ## 개요 **F1 score**(F1 점수)는 머신러닝과 데이터 과학 분야에서 분류 모델의 성능을 평가하는 데 널리 사용되는 지표입니다. 특히 **정밀도**(Precision)와 **재현율**(Recall) 사이의 균형을 중요시할 때 유용하며, 두 지표의 조화 평균(Harmonic Mean)으로 정의됩니다. F1 score는 불균형...
# 인공지능 성능 측정 인공지능(AI)의 성능 측정은 AI 시스템이 주어진 과제를 얼마나 효과적이고 정확하게 수행하는지를 평가하는 과정입니다. AI 기술이 급속도로 발전함에 따라, 단순한 정확도 이상의 다양한 지표를 활용하여 모델의 신뢰성, 효율성, 공정성 등을 종합적으로 평가하는 것이 중요해졌습니다. 이 문서는 인공지능 성능 측정의 주요 개념, 평가 지...
# 부정 클래스 ## 개요 머신러닝, 특히 **분류(Classification)** 작업에서 "부정 클래스(Negative Class)"는 특정 관심 있는 사건(또는 객체)이 **발생하지 않았음**을 나타내는 범주를 의미합니다. 이는 "양성 클래스(Positive Class)"와 대조되는 개념으로, 이진 분류(Binary Classification)에서...
# 클래스 불균형 ## 개요 **클래스 불균형**(Class Imbalance)은 머신러닝에서 분류 문제를 다룰 때, 특정 클래스의 샘플 수가 다른 클래스에 비해 현저히 적거나 많은 경우를 의미합니다. 예를 들어, 사기 탐지 시스템에서 정상 거래는 수백만 건인 반면 사기 거래는 수천 건에 불과할 수 있으며, 이 경우 사기 클래스(소수 클래스)는 전체 데...
# 종속변수 ## 개요 **종속변수(Dependent Variable)**는 통계·머신러닝 모델에서 *예측하거나 설명하고자 하는 대상*을 의미한다. 회귀분석(regression analysis)에서는 독립변수(설명변수, predictor)와의 관계를 통해 종속변수의 값을 추정한다. 종속변수는 연구 목적에 따라 **연속형**, **이산형**, **범...
# 군집화 (Clustering) ## 개요 군집화(Clustering)는 **비지도 학습(Unsupervised Learning)** 기법 중 하나로, 사전에 레이블이 없는 데이터 집합을 **유사한 특성을 가진 그룹(군집, cluster)** 으로 자동 분할하는 방법을 말한다. 데이터 포인트 간의 거리 혹은 유사도 측정을 기반으로, 같은 군집에 속한...
# CNN/Daily Mail ## 개요 **CNN/Daily Mail**(줄여서 **C/D M**)은 자연어 처리(NLP) 분야에서 **추상적 요약(abstractive summarization)** 및 **추출적 요약(extractive summarization)** 모델을 평가하기 위해 널리 사용되는 대규모 벤치마크 데이터셋이다. 2015년 **...
# 질문 응답 시스템 ## 개요 질문 응답 시스템(Question Answering, QA)은 사용자가 자연어로 제시한 질문에 대해 **정확하고 간결한 답변**을 자동으로 생성하는 기술이다. 전통적인 정보 검색(IR) 시스템이 “문서 목록”을 반환한다면, QA 시스템은 “답변 자체”를 제공한다는 점에서 차별화된다. 최근 딥러닝, 특히 **대규모 사전학습 ...
# 자동 추천 기능 ## 개요 자동 추천 기능(Recommendation System)은 사용자의 과거 행동, 선호도, 컨텍스트 정보를 분석하여 개인화된 아이템(상품, 콘텐츠, 서비스 등)을 실시간으로 제시하는 기술이다. 전자상거래, 동영상 스트리밍, 뉴스 포털, 소셜 네트워크 등 다양한 도메인에서 핵심 비즈니스 가치를 창출한다. 본 문서는 자동 추천...
# 표준오차 ## 개요 **표준오차**(Standard Error, SE)는 통계학에서 표본 통계량(예: 표본평균)이 모집단의 진짜 모수(예: 모평균)를 얼마나 정확하게 추정하는지를 나타내는 지표입니다. 즉, 표준오차는 **표본 통계량의 변동성**을 측정하며, 반복적으로 표본을 추출했을 때 그 통계량이 어느 정도의 분포를 갖는지를 설명합니다. 표준오차...
# Sennrich et al. (2016) ## 개요 Sennrich et al. (2016)은 자연어처리, 특히 **기계 번역**(Machine Translation, MT) 분야에서 중요한 전환점을 마련한 논문으로, **백워드 번역**(Back-Translation)과 **서브워드 유닛**(Subword Units) 기반의 **바이트 페어 인코딩*...
# 회귀 분석 회귀 분석(Regression Analysis)은 통계학에서 두 개 이상의 변수 간의 관계를 모델링하고 분석하는 대표적인 기법 중 하나입니다. 특히 한 변수(종속 변수)가 다른 변수들(독립 변수 또는 설명 변수)에 의해 어떻게 영향을 받는지를 수학적으로 표현함으로써 예측 및 추론을 가능하게 합니다. 회귀 분석은 경제학, 사회과학, 의학, 공...
# 가중치 평균 ## 개요 **가중치 평균**(Weighted Average)은 단순 평균(Arithmetic Mean)과 달리 각 신뢰도를 반영하기 위해 **가중치**(Weight)를 부여하여 계산하는 평균 방식입니다. 특히 **데이터과학**과 **모델 평가** 분야에서 다양한 지표를 종합하거나, 클래스 불균형이 있는 분류 문제에서 성능을 평가할 때 ...
# 거짓 음성 ## 개요 **거짓 음성**(False Negative, FN)은 분류 모델의 예측 결과와 실제 정답 사이의 불일치를 나타내는 중요한 평가 지표 중 하나로, 특히 **이진 분류**(binary classification) 문제에서 핵심적인 개념입니다. 거짓 음성은 실제 긍정 클래스(Positive)에 속하는 사례를 모델이 부정 클래스(Ne...
# KDD ## 개요 **KDD**(Knowledge Discovery in Databases, 데이터베이스에서의 지식 발견)는 대량의 데이터에서 숨겨진 패턴, 규칙, 관계, 또는 유용한 정보를 추출하는 과정을 의미하는 데이터과학 분야의 핵심 개념입니다. KDD는 단순한 데이터 분석을 넘어서, 데이터 전처리, 데이터 마이닝, 패턴 평가, 지식 표현까지를...
# 지도 학습 ## 개요 **지도 학습**(Supervised Learning)은 머신러닝의 핵심 학습 방법 중 하나로, **입력 데이터**(특징, features)와 그에 대응하는 **정답 레이블**(정답, labels)이 함께 주어진 상태에서 모델이 데이터의 패턴을 학습하여 새로운 입력에 대해 정확한 출력을 예측하도록 훈련하는 방식입니다. 이 방법은...