정밀도
# 정밀도 정밀도(Precision)는 인공능, 특히 머신러닝 모의 성능을 평가하는심 지표 중 하나로, **모델이 '긍정'으로 예측한 샘플 중 실제로 긍정인 비율**을 의미합니다. 주로 분류 문제에서 사용되며, 특히 불균형 데이터셋(imbalanced dataset)...
# 정밀도 정밀도(Precision)는 인공능, 특히 머신러닝 모의 성능을 평가하는심 지표 중 하나로, **모델이 '긍정'으로 예측한 샘플 중 실제로 긍정인 비율**을 의미합니다. 주로 분류 문제에서 사용되며, 특히 불균형 데이터셋(imbalanced dataset)...
# Hallucination ## 개요 **Hallucination**(환)은 인공지능, 특히 자연 처리(NLP) 분야에서 **생성형 언어 모델**(Gener Language Model)이 사실과 무하거나 허위인 내용을 자신감 있게 생성하는 현상을 의미합니다.는 모...
# 프롬프트 기반 추 ## 개요**프롬프트반 추론**(-based Reasoning) 인공지능, 대규모 언 모델(Large Language Models,LM)의 성능을 평가하고 향상시키기 위한 핵심적인 방법론 중 하나입니다 이 기법은 모델이 주어진(프롬프트)을 바으로...
# LIME ## 개요 LIME (Local Interpretable-agnostic Explanations)는 복잡한 머신러닝 모의 예측 결과를 인간이 이해할 수 있도록석하는 데 사용되는 **모 무관**(model-agnostic)한 설명 기법입니다. 딥러닝과 같...
# 퍼플렉서티 ## 개요 **퍼플렉서티**(plexity)는 자연어(Natural Language Processing NLP) 분야 언어 모델(Language Model)의 성능을 평가하는 대표적인 지표 중 하나입니다 직관적으로, 퍼플렉서티 모델이 주어진 텍스트 시...
# Bias Benchmark for QA ## 개 **Bias Benchmark for QA질문-응답 시스의 편향 평가 벤치마크)는 인공지능 기반 질문-응답(Question Answering, QA 모델에서 발생 수 있는 사회적,화적, 성, 인종적 편향을 체계적으...
# Gender Bias Score ## 개요 **Gender Bias Score**(성별 편향 점)는 인공지능 모델, 특히 자연어 처리(NLP) 모델이나 이미지 생성 모델에서 성별에 기반한 편(bias)의를 정량적으로 평가하기 위해 사용되는표입니다. 이 점수는 모...
# MSE ## 개요 **MSE**(Mean Squared Error, 평균 제곱 오차)는 회귀(regression) 문제에서 예측 모델의 성능을 평가하는 데 널리 사용되는 지표입니다. 이는 예측과 실제 관측값 사이의 차이(오차)를 제곱한 후, 그 평균을 계산함으로...
# 성능 평가 인공지능(AI) 모델의 **성능 평가Performance Evaluation)는 개발된 모델이 주어진 과제(Task)를 얼마나 정확하고 신뢰성 있게 수행하는지를 정량적·정성적으로 분석하는 과정입니다. 모델의 훈련 과정 이후, 성능 평가는 모델의 실용성과...
# 매크로 F1 ## 개요 **매크로 F1Macro F1)은중 클래스 분류(Multiclass Classification) 문제에서 모델의 성능을 평가하기 위한 지표 중 하나로, 각 클래스별 **F1 점수**(F1 Score)를 계산한 후, 이를 단순 평균하여 전체...
# 긍정적 예측 ## 개요 **긍정적 예측**(Positive Prediction)은 인공지능, 특히 머신러닝 모델의 평가 과정에서 중요한 개념 중 하나로, 모델 특정 샘플이 "긍정 클래스(Positive Class)"에 속한다고 예측한 경우를 의미합니다. 이는 이...
# 파인튜닝 ## 개요 **파인튜닝**(Fine-tuning)은 사전 훈련된(pre-trained) 인공지능 모델을 특정 작업이나 도메인에 맞게 추가로 훈련하여 성능을 최적화하는 기법입니다. 주로 딥러닝 기반의 자연어 처리(NLP), 컴퓨터 비전(CV), 음성 인식...
# R² ## 개요 **R²**(R-squared, 결정계수)는 통계학 및 기계학습에서 회귀 모델의 성능을가하는 대표 지표 중 하나입니다. R² 모델이 종속 변수(dependent variable)의 분산 중 얼마나 많은 부분을 설명할 수 있는지를 나타내는 값으로,...
# Counterfactual Examples ##요 **Counterfactual Examples반사실적 예시는 인공지(AI), 특히 머신러닝 모델의 **해석 가능성**(interpretability)과 **공정성**(fairness), **로버스트성**(robu...
# F1 점수 ## 개요 F1 점수1 Score)는 인공지능 머신러닝 분야에서 분류 모델의 성능을 평가 데 널리 사용되는 지입니다. 특히 **밀도**(Precision)와 **재현율**(Recall)을 조화롭게 결합한 지표로, 두 값의 조화 평균(Harmonic M...