위키너와나

Categorical Cross-Entropy

기술 > 인공지능 > 분류 | 익명 | 2026-06-20 | 조회수 2

# Categorical Cross-Entropy (범주형 교차 엔트로피) ## 개요 **Categorical Cross-Entropy**(범주형 교차 엔트로피)는 머신러닝, 특히 딥러닝 분야에서 다중 클래스 분류(Multi-class Classification) 문제의 손실 함수(Loss Function)로 널리 사용되는 지표입니다. 이 함수는 모델이...

#Categorical Cross-Entropy #손실 함수 #딥러닝 #다중 클래스 분류 #Softmax #PyTorch #TensorFlow #정보 이론

병렬 코퍼스

기술 > 자연어처리 > 기계 번역 | 익명 | 2026-06-20 | 조회수 2

# 병렬 코퍼스 (Parallel Corpus) ## 개요 **병렬 코퍼스**(Parallel Corpus)는 자연어 처리(Natural Language Processing, NLP), 특히 기계 번역(Machine Translation) 분야에서 핵심적인 역할을 하는 대규모 텍스트 데이터셋입니다. 병렬 코퍼스는 두 개 이상의 언어로 번역된 동일한 내용...

#병렬 코퍼스 #기계 번역 #자연어 처리 #NLP #신경망 기계 번역 #문장 정렬 #데이터 구축 #교차 언어 임베딩

프라이버시 문제

기술 > 보안 > 데이터 보호 | 익명 | 2026-06-20 | 조회수 2

# 프라이버시 문제 (Privacy Issues) ## 개요 **프라이버시 문제**(Privacy Issues)란 디지털 환경, 특히 인터넷과 정보 통신 기술(ICT)의 급속한 발전으로 인해 개인의 사생활이 침해되거나 통제 불가능한 수준으로 데이터가 수집·활용되는 현상을 포괄적으로 지칭하는 개념입니다. 전통적인 '사생활의 권리'가 물리적 공간에서의 은밀...

#프라이버시 #정보 프라이버시 #데이터 보호 #개인정보 보호 #GDPR #암호화 #차등 프라이버시 #보안 #감시 자본주의 #데이터 윤리

fast.ai

기술 > 프로그래밍 > Python | 익명 | 2026-06-20 | 조회수 0

# fast.ai **fast.ai**는 제레미 하워드(Jeremy Howard)와 서필라 라드먼(Sylvia Radzeman)이 주도하여 개발한 오픈 소스 라이브러리 및 교육 플랫폼입니다. 이 프로젝트의 핵심 목표는 심층 학습(Deep Learning) 기술을 대중화하고, 연구자들이나 개발자들이 복잡한 수학적 배경 지식 없이도 효율적으로 심층 신경망을 ...

#fastai #PyTorch #딥러닝 #고수준 API #컴퓨터 비전 #자연어 처리 #데이터 사이언스 #오픈 소스

캐글

기술 > 데이터과학 > 분석 | 익명 | 2026-06-20 | 조회수 2

# 캐글(Kaggle) **캐글(Kaggle)**은 데이터 과학, 머신러닝, 인공지능(AI) 분야에서 세계 최대 규모의 온라인 커뮤니티이자 플랫폼입니다. 2010년 이반 오스틴(Ivan Osuna), 로버트 머피(Robert Murphy), 애덤 아론슨(Adam Aronson)에 의해 설립되었으며, 2017년 구글(Google)에 인수되어 현재는 구글의 ...

#Kaggle #데이터 과학 #머신러닝 #AI #경진대회 #Notebook #구글 #파이썬 #데이터셋 #커뮤니티

Bag-of-Words

기술 > 데이터과학 > 텍스트 수치화 | 익명 | 2026-06-20 | 조회수 2

# Bag-of-Words (단어 가방 모델) ## 개요 **Bag-of-Words**(BoW, 단어 가방 모델)는 자연어 처리(NLP) 분야에서 텍스트 데이터를 기계가 이해할 수 있는 수치적 벡터 형태로 변환하는 가장 기본적이고 고전적인 방법론 중 하나입니다. 이 모델은 텍스트의 문법적 구조나 단어의 순서(문맥)를 무시하고, 문서 내에 등장하는 단어의...

#Bag-of-Words #자연어처리 #NLP #텍스트전처리 #TF-IDF #벡터화 #CountVectorizer #중급

ggplot2

기술 > 프로그래밍 > 시각화 도구 | 익명 | 2026-06-20 | 조회수 2

# ggplot2 **ggplot2**는 R 프로그래밍 언어를 위한 데이터 시각화 패키지로, Leland Wilkinson의 그래픽 구문론(Graphical Grammar) 이론을 바탕으로 개발되었습니다. Hadley Wickham이 2005년에 처음 개발한 이후, R 커뮤니티에서 가장 널리 사용되는 시각화 도구 중 하나로 자리 잡았으며, 복잡한 데이터셋...

#ggplot2 #R #데이터 시각화 #그래픽 구문론 #선언적 프로그래밍 #레이어 기반 시스템 #dplyr #plotly #패키지 생태계 #중급

BERT

기술 > 인공지능 > 언어 모델링 | 익명 | 2026-06-20 | 조회수 0

# BERT (Bidirectional Encoder Representations from Transformers) **BERT**(Bidirectional Encoder Representations from Transformers)는 구글(Google)이 2018년 10월 공개한 사전 학습(pre-training) 기반의 자연어 처리(NLP) 모델입니다...

#BERT #자연어 처리 #트랜스포머 #사전 학습 #파인튜닝 #마스크드 언어 모델 #인코더 #NLP

SBERT

기술 > 자연어처리 > 문장 임베딩 | 익명 | 2026-06-20 | 조회수 2

# SBERT (Sentence-BERT) **SBERT**(Sentence-BERT)는 자연어 처리(NLP) 분야에서 문장 수준(Sentence-level)의 의미적 유사도(Semantic Similarity)를 측정하기 위해 최적화된 BERT 기반의 임베딩 모델입니다. 기존 BERT가 단어 단위나 문장 내 토큰 단위의 표현을 학습하는 데 중점을 둔 반...

#SBERT #Sentence-BERT #자연어처리 #NLP #문장임베딩 #의미적유사도 #SiameseNetwork #HuggingFace #SentenceTransformers #FAISS

XSum

기술 > 자연어처리 > 벤치마크 | 익명 | 2026-06-20 | 조회수 2

# XSum (Extreme Summarization) **XSum**은 자연어 처리(NLP), 특히 텍스트 요약(Text Summarization) 분야에서 널리 사용되는 대규모 엔드투엔드(End-to-End) 요약 벤치마크 데이터셋입니다. 2018년 옥스퍼드 대학의 NLP 연구팀에 의해 공개된 이 데이터셋은 기존 요약 데이터셋들이 가진 한계를 극복하기...

#XSum #텍스트 요약 #생성식 요약 #NLP #벤치마크 데이터셋 #ROUGE #BERTScore #BBC 뉴스 #단문 요약 #LLM

RSS

통계학 > 회귀분석 > 모델 평가 | 익명 | 2026-06-20 | 조회수 3

# RSS (Residual Sum of Squares) **RSS**(Residual Sum of Squares, 잔차 제곱합)는 통계학, 특히 **회귀분석(Regression Analysis)**에서 통계 모델의 적합도(Goodness of Fit)를 평가하는 핵심 지표 중 하나입니다. RSS는 관측된 데이터 값과 모델이 예측한 값 사이의 차이인 **...

#RSS #회귀분석 #모델 평가 #잔차 제곱합 #MSE #R-squared #통계학 #최소제곱법

Supervised Fine-tuning

기술 > 인공지능 > 지도학습 | 익명 | 2026-06-20 | 조회수 0

# Supervised Fine-tuning (지도 미세 조정) **Supervised Fine-tuning**(SFT, 지도 미세 조정)은 대규모 언어 모델(Large Language Model, LLM)이나 다른 딥러닝 모델을 특정 작업이나 도메인에 맞게 전문화시키기 위해, 레이블이 지정된 데이터셋을 사용하여 사전 학습된 모델의 가중치를 추가로 학습시...

#Supervised Fine-tuning #지도 미세 조정 #LLM #거대 언어 모델 #인공지능 #RLHF #LoRA #지시 따르기 #데이터 정제 #고급

변분 추론

기술 > 머신러닝 > 추론 방법 | 익명 | 2026-06-20 | 조회수 1

# 변분 추론 (Variational Inference) **변분 추론(Variational Inference, VI)**은 확률 모델에서 사후 확률(posterior distribution)을 근사하기 위한 방법론 중 하나입니다. 베이지안 통계학에서 사후 확률은 베이즈 정리를 통해 계산되지만, 많은 복잡한 모델에서 정확한 사후 확률의 계산은 불가능하거나...

#변분 추론 #베이지안 통계 #확률 모델 #ELBO #KL 발산 #VAE #SVI #중급

인공지능

기술 > 인공지능 > 확률적 모델 | 익명 | 2026-06-20 | 조회수 0

# 인공지능: 확률적 모델과 현대 AI의 기초 ## 개요 **인공지능(Artificial Intelligence, AI)**은 인간의 지능적 행위를 모방하여 문제를 해결하거나 결정을 내릴 수 있는 컴퓨터 시스템이나 소프트웨어를 포괄하는 광범위한 기술 분야입니다. 초기에는 논리적 추론과 규칙 기반 시스템에 중점을 두었으나, 21세기에 들어서는 데이터의 양...

#인공지능 #확률적 모델 #머신러닝 #딥러닝 #베이지안 네트워크 #불확실성 #생성 모델 #판별 모델 #중급

병렬 처리

기술 > 컴퓨터과학 > 병렬 처리 | 익명 | 2026-06-19 | 조회수 0

# 병렬 처리 (Parallel Processing) **병렬 처리**(Parallel Processing)란 하나의 복잡한 문제를 여러 개의 작은 하위 문제로 분할하여, 이를 동시에 처리함으로써 계산 속도를 높이고 시스템의 효율성을 극대화하는 컴퓨터 과학 및 공학 기법입니다. 단일 프로세서가 순차적으로 작업을 처리하는 직렬 처리(Serial Proces...

#병렬 처리 #GPU 컴퓨팅 #분산 처리 #CUDA #OpenMP #MPI #Apache Spark #암달의 법칙 #데이터 병렬 #작업 병렬

위양성율

기술 > 데이터과학 > 모델 평가 | 익명 | 2026-06-19 | 조회수 2

# 위양성율 (False Positive Rate) **위양성율**(False Positive Rate, 약자 **FPR**)은 이진 분류(Binary Classification) 문제에서 실제 음성(Negative)인 샘플 중 모델이 양성(Positive)으로 잘못 예측한 비율을 의미합니다. 즉, "사건이 발생하지 않았음에도 불구하고 사건이 발생했다고 ...

#위양성율 #False Positive Rate #FPR #이진 분류 #모델 평가 #ROC 곡선 #AUC #혼동 행렬 #특이도 #민감도

편향

기술 > 인공지능 > 공정성 | 익명 | 2026-06-19 | 조회수 0

# 편향 (Bias) **편향(Bias)**은 인공지능(AI) 시스템이 학습 데이터나 알고리즘 설계 과정에서 발생하는 체계적인 오류로 인해 특정 개인이나 집단에 대해 공정하지 않거나 차별적인 결과를 도출하는 현상을 의미합니다. 특히 인공지능의 **공정성(Fairness)** 분야에서 핵심적인 논의 대상이 되며, 기술적 결함뿐만 아니라 사회적 편견이 시스템...

#인공지능 #AI 편향 #공정성 #데이터 편향 #알고리즘 편향 #윤리 #편향 완화 #설명 가능성

레이블의 분포

기술 > 데이터과학 > 데이터 정제 | 익명 | 2026-06-19 | 조회수 1

# 레이블의 분포 (Label Distribution) ## 개요 **레이블의 분포(Label Distribution)**는 기계 학습(Machine Learning) 및 데이터 과학 분야에서 분류(Classification) 문제의 타겟 변수(Target Variable)가 데이터셋 내에서 어떻게 할당되어 있는지를 나타내는 통계적 특성입니다. 특히 지...

#레이블 분포 #불균형 데이터 #기계 학습 #SMOTE #오버샘플링 #언더샘플링 #F1-Score #ROC-AUC #scikit-learn #데이터 과학

환각

기술 > 인공지능 > 생성형 AI | 익명 | 2026-06-19 | 조회수 3

# 환각 (환각 현상) **환각**(幻覺, 영어: **Hallucination**)은 생성형 인공지능(Generative AI), 특히 대규모 언어 모델(Large Language Models, LLMs)이 사실과 다르거나 존재하지 않는 정보를 사실인 것처럼 생성해 내는 현상을 의미합니다. 이는 인공지능의 신뢰성을 해치는 주요한 결함 중 하나로, 모델이 ...

#환각 #생성형 AI #LLM #RAG #프롬프트 엔지니어링 #AI 신뢰성 #대규모 언어 모델

catastrophic forgetting

기술 > 인공지능 > 머신러닝 | 익명 | 2026-06-16 | 조회수 11

# 파괴적 망각 (Catastrophic Forgetting) 파괴적 망각은 연속 학습(Continual Learning) 환경에서 인공지능 모델이 새로운 작업을 학습하는 과정에서 기존 작업의 성능이 급격히 저하되는 현상을 의미합니다. 이는 인간 학습자가 새로운 지식을 습득하더라도 기존 지식을 완전히 잊지 않는 능력과 대비되는 머신러닝의 근본적인 한계 중...

#파괴적 망각 #연속 학습 #머신러닝 #딥러닝 #EWC #SI #Replay Buffer #가소성-안정성 딜레마

검색 결과