위키너와나

수동 평가

익명 • 2026-06-20 • 조회수 0

기술 / 인공지능 / 모델 평가

# 수동 평가 (Manual Evaluation) ## 개요 **수동 평가**(Manual Evaluation)란 인공지능(AI), 특히 자연어 처리(NLP) 및 생성형 AI 모델의 성능을 측정할 때, 컴퓨터가 자동으로 계산하는 지표(예: BLEU, ROUGE, 정...

재현율

익명 • 2026-06-13 • 조회수 4

기술 / 인공지능 / 모델 평가

# 재현율 (Recall) **재현율**(Recall)은 머신러닝과 데이터 과학 분야에서 분류(Classification) 모델의 성능을 평가하는 핵심 지표 중 하나입니다. 특히 불균형 데이터(Imbalanced Data)가 존재하거나, 거짓 음성(False Nega...

재현율 Recall 분류 모델 +5

편향

익명 • 2026-06-13 • 조회수 1

기술 / 인공지능 / 모델 평가

# 편향 (Bias) **편향(Bias)**은 인공지능, 특히 머신러닝 및 딥러닝 모델의 평가와 개발 과정에서 가장 중요한 윤리적·기술적 이슈 중 하나입니다. 이는 모델이 학습 데이터나 알고리즘 설계의 특성으로 인해 특정 그룹, 성별, 인종, 종교, 사회경제적 지위 ...

AI 편향 머신러닝 딥러닝 +6

자동 추천 기능

익명 • 2026-02-24 • 조회수 35

기술 / 인공지능 / 모델 평가

# 자동 추천 기능 ## 개요 자동 추천 기능(Recommendation System)은 사용자의 과거 행동, 선호도, 컨텍스트 정보를 분석하여 개인화된 아이템(상품, 콘텐츠, 서비스 등)을 실시간으로 제시하는 기술이다. 전자상거래, 동영상 스트리밍, 뉴스 포털, 소...

추천 시스템 협업 필터링 콘텐츠 기반 필터링 +7

MAE

익명 • 2025-12-15 • 조회수 49

기술 / 인공지능 / 모델 평가

# MAE ## 개요 **MAE**(Mean Absolute Error, 평균 절대 오차)는 회귀(regression) 문제에서 예측값과 실제값 사이의 오차를 평가하는 대표적인 지표 중 하나입니다. 인공지능 모델, 특히 회귀 모델의 성능을 측정할 때 널리 사용되며,...

MAE 회귀 평가 지표 평균 절대 오차 +2

정밀도

익명 • 2025-10-11 • 조회수 55

기술 / 인공지능 / 모델 평가

# 정밀도 정밀도(Precision)는 인공능, 특히 머신러닝 모의 성능을 평가하는심 지표 중 하나로, **모델이 '긍정'으로 예측한 샘플 중 실제로 긍정인 비율**을 의미합니다. 주로 분류 문제에서 사용되며, 특히 불균형 데이터셋(imbalanced dataset)...

정밀도 정밀도와재현율 혼동행렬 +2

Hallucination

익명 • 2025-10-06 • 조회수 55

기술 / 인공지능 / 모델 평가

# Hallucination ## 개요 **Hallucination**(환)은 인공지능, 특히 자연 처리(NLP) 분야에서 **생성형 언어 모델**(Gener Language Model)이 사실과 무하거나 허위인 내용을 자신감 있게 생성하는 현상을 의미합니다.는 모...

Hallucination 생성형 언어 모델 사실 정확성 +2

프롬프트 기반 추론

익명 • 2025-10-03 • 조회수 59

기술 / 인공지능 / 모델 평가

# 프롬프트 기반 추 ## 개요**프롬프트반 추론**(-based Reasoning) 인공지능, 대규모 언 모델(Large Language Models,LM)의 성능을 평가하고 향상시키기 위한 핵심적인 방법론 중 하나입니다 이 기법은 모델이 주어진(프롬프트)을 바으로...

프롬프트 기반 추론 체인 오브 씽크 대규모 언어 모델 +2

LIME

익명 • 2025-10-02 • 조회수 60

기술 / 인공지능 / 모델 평가

# LIME ## 개요 LIME (Local Interpretable-agnostic Explanations)는 복잡한 머신러닝 모의 예측 결과를 인간이 이해할 수 있도록석하는 데 사용되는 **모 무관**(model-agnostic)한 설명 기법입니다. 딥러닝과 같...

LIME 모델 무관성 지역적 해석 +2

퍼플렉서티

익명 • 2025-09-25 • 조회수 71

기술 / 인공지능 / 모델 평가

# 퍼플렉서티 ## 개요 **퍼플렉서티**(plexity)는 자연어(Natural Language Processing NLP) 분야 언어 모델(Language Model)의 성능을 평가하는 대표적인 지표 중 하나입니다 직관적으로, 퍼플렉서티 모델이 주어진 텍스트 시...

퍼플렉서티 언어 모델 NLP 평가 지표 +2

Bias Benchmark for QA

익명 • 2025-09-22 • 조회수 68

기술 / 인공지능 / 모델 평가

# Bias Benchmark for QA ## 개 **Bias Benchmark for QA질문-응답 시스의 편향 평가 벤치마크)는 인공지능 기반 질문-응답(Question Answering, QA 모델에서 발생 수 있는 사회적,화적, 성, 인종적 편향을 체계적으...

Bias Benchmark for QA 질문-응답 모델 사회적 편향 평가 +2

Gender Bias Score

익명 • 2025-09-22 • 조회수 70

기술 / 인공지능 / 모델 평가

# Gender Bias Score ## 개요 **Gender Bias Score**(성별 편향 점)는 인공지능 모델, 특히 자연어 처리(NLP) 모델이나 이미지 생성 모델에서 성별에 기반한 편(bias)의를 정량적으로 평가하기 위해 사용되는표입니다. 이 점수는 모...

Gender Bias Score 성별 편향 평가 NLP 모델 +2

MSE

익명 • 2025-09-15 • 조회수 99

기술 / 인공지능 / 모델 평가

# MSE ## 개요 **MSE**(Mean Squared Error, 평균 제곱 오차)는 회귀(regression) 문제에서 예측 모델의 성능을 평가하는 데 널리 사용되는 지표입니다. 이는 예측과 실제 관측값 사이의 차이(오차)를 제곱한 후, 그 평균을 계산함으로...

MSE 회귀 평가 지표 손실 함수 +2

성능 평가

익명 • 2025-09-09 • 조회수 100

기술 / 인공지능 / 모델 평가

# 성능 평가 인공지능(AI) 모델의 **성능 평가Performance Evaluation)는 개발된 모델이 주어진 과제(Task)를 얼마나 정확하고 신뢰성 있게 수행하는지를 정량적·정성적으로 분석하는 과정입니다. 모델의 훈련 과정 이후, 성능 평가는 모델의 실용성과...

성능 평가 평가 지표 교차 검증 +2

매크로 F1

익명 • 2025-09-07 • 조회수 81

기술 / 인공지능 / 모델 평가

# 매크로 F1 ## 개요 **매크로 F1Macro F1)은중 클래스 분류(Multiclass Classification) 문제에서 모델의 성능을 평가하기 위한 지표 중 하나로, 각 클래스별 **F1 점수**(F1 Score)를 계산한 후, 이를 단순 평균하여 전체...

매크로 F1 다중 클래스 분류 모델 평가 +2

긍정적 예측

익명 • 2025-09-06 • 조회수 99

기술 / 인공지능 / 모델 평가

# 긍정적 예측 ## 개요 **긍정적 예측**(Positive Prediction)은 인공지능, 특히 머신러닝 모델의 평가 과정에서 중요한 개념 중 하나로, 모델 특정 샘플이 "긍정 클래스(Positive Class)"에 속한다고 예측한 경우를 의미합니다. 이는 이...

일반 문서

파인튜닝

익명 • 2025-09-03 • 조회수 80

기술 / 인공지능 / 모델 평가

# 파인튜닝 ## 개요 **파인튜닝**(Fine-tuning)은 사전 훈련된(pre-trained) 인공지능 모델을 특정 작업이나 도메인에 맞게 추가로 훈련하여 성능을 최적화하는 기법입니다. 주로 딥러닝 기반의 자연어 처리(NLP), 컴퓨터 비전(CV), 음성 인식...

파인튜닝 전이 학습 LoRA +2

R²

익명 • 2025-09-02 • 조회수 77

기술 / 인공지능 / 모델 평가

# R² ## 개요 **R²**(R-squared, 결정계수)는 통계학 및 기계학습에서 회귀 모델의 성능을가하는 대표 지표 중 하나입니다. R² 모델이 종속 변수(dependent variable)의 분산 중 얼마나 많은 부분을 설명할 수 있는지를 나타내는 값으로,...

R² 회귀 분석 결정계수 +2

Counterfactual Examples

익명 • 2025-09-02 • 조회수 80

기술 / 인공지능 / 모델 평가

# Counterfactual Examples ##요 **Counterfactual Examples반사실적 예시는 인공지(AI), 특히 머신러닝 모델의 **해석 가능성**(interpretability)과 **공정성**(fairness), **로버스트성**(robu...

Counterfactual Examples 설명 가능한 AI 모델 평가 +4

F1 점수

익명 • 2025-09-02 • 조회수 77

기술 / 인공지능 / 모델 평가

# F1 점수 ## 개요 F1 점수1 Score)는 인공지능 머신러닝 분야에서 분류 모델의 성능을 평가 데 널리 사용되는 지입니다. 특히 **밀도**(Precision)와 **재현율**(Recall)을 조화롭게 결합한 지표로, 두 값의 조화 평균(Harmonic M...

F1 점수 정밀도 재현율 +3