위키너와나

Out-of-Vocabulary

익명 • 2026-04-15 • 조회수 21

기술 / 자연어처리 / 오류 정정

# Out-of-Vocabulary ## 개요 자연어처리(Natural Language Processing, NLP) 분야에서 **Out-of-Vocabulary**(OoV)는 모델이 학습 과정에서 접하지 못한 단어를 의미합니다. 이는 텍스트 데이터를 처리하는 시스...

Levenshtein Distance

익명 • 2026-04-09 • 조회수 17

기술 / 자연어처리 / 오류 정정

# Levenshtein Distance ## 개요 **레벤슈타인 거리**(Levenshtein Distance)는 두 문자열 간의 유사도를 측정하는 데 사용되는 **편집 거리**(Edit Distance)의 한 형태로, 한 문자열을 다른 문자열로 변환하는 데 필요...

레벤슈타인 거리 편집 거리 동적 프로그래밍 +2

ELMo

익명 • 2026-04-09 • 조회수 18

기술 / 자연어처리 / 문맥 임베딩

# ELMo ## 개요 **ELMo**(Embeddings from Language Models)는 자연어처리(NLP) 분야에서 획기적인 성과를 이룬 **문맥 기반 단어 임베딩**(contextualized word embedding) 기술 중 하나로, 2018년 ...

ELMo 문맥 기반 임베딩 BiLSTM +4

BERT

익명 • 2026-04-09 • 조회수 15

기술 / 자연어처리 / 임베딩

# BERT ## 개요 **BERT**(Bidirectional Encoder Representations from Transformers)는 자연어 처리(NLP) 분야에서 혁신적인 영향을 미친 언어 모델로, 2018년 구글(Google) 연구팀에 의해 개발되었습니...

BERT 자연어처리 트랜스포머 +6

CNN/Daily Mail

익명 • 2026-02-26 • 조회수 42

기술 / 자연어처리 / 벤치마크

# CNN/Daily Mail ## 개요 **CNN/Daily Mail**(줄여서 **C/D M**)은 자연어 처리(NLP) 분야에서 **추상적 요약(abstractive summarization)** 및 **추출적 요약(extractive summarizatio...

CNN/Daily Mail abstractive summarization extractive summarization +5

질문 응답 시스템

익명 • 2026-02-25 • 조회수 35

기술 / 자연어처리 / 질문 응답

# 질문 응답 시스템 ## 개요 질문 응답 시스템(Question Answering, QA)은 사용자가 자연어로 제시한 질문에 대해 **정확하고 간결한 답변**을 자동으로 생성하는 기술이다. 전통적인 정보 검색(IR) 시스템이 “문서 목록”을 반환한다면, QA 시스템...

질문 응답 추출형 QA 생성형 QA +5

규칙 기반 방법

익명 • 2026-01-30 • 조회수 33

기술 / 자연어처리 / 전처리

# 규칙 기반 방법 자연어처리(Natural Language Processing, NLP)는 인간의 언어를 컴퓨터가 이해하고 분석할 수 있도록 하는 기술 분야이다. 이 과정에서 언어 데이터를 분석하기 전에 정제하고 구조화하는 단계인 **전처리**(preprocessi...

자연어처리 규칙 기반 방법 전처리 +2

기계학습 기반 방법

익명 • 2026-01-29 • 조회수 34

기술 / 자연어처리 / 분석 방법

# 기계학습 기반 방법 ## 개요 기계학습 기반 방법(Machine Learning-based Approach)은 자연어처리(Natural Language Processing, NLP) 분야에서 언어 데이터의 패턴을 자동으로 학습하고 이를 기반으로 다양한 언어 과제...

기계학습 기반 방법 자연어처리 지도 학습 +2

맥락 의존성

익명 • 2026-01-25 • 조회수 35

기술 / 자연어처리 / 언어 이해

# 맥락 의존성 ## 개요 **맥락 의존성**(Context Dependency)은 자연어처리(Natural Language Processing, NLP) 분야에서 언어의 의미가 단어나 문장 자체보다는 그 주변의 언어적 또는 비언어적 맥락에 따라 달라질 수 있다는 ...

맥락 의존성 자연어처리 트랜스포머 모델 +2

동시출현 행렬

익명 • 2026-01-23 • 조회수 36

기술 / 자연어처리 / 데이터 분석

# 동시출현 행렬 ## 개요 **동시출현 행렬**(Co-occurrence Matrix)은 자연어처리(NLP) 분야에서 언어의 통계적 구조를 분석하고 단어 간의 의미적 관계를 모델링하는 데 사용되는 중요한 데이터 구조입니다. 이 행렬은 특정한 문맥 내에서 두 단어가...

동시출현 행렬 자연어처리 단어 임베딩 +7

의도 파악

익명 • 2026-01-21 • 조회수 44

기술 / 자연어처리 / 의도 감지

# 의도 파악 의도 파악(Intent Detection)은 자연어처리(Natural Language Processing, NLP)의 핵심 기술 중 하나로, 사용자가 자연어로 입력한 문장이나 발화에서 **사용자의 목적 또는 행동 의도**를 추론하고 분류하는 작업을 말합...

의도 파악 자연어처리 의도 분류 +2

Sennrich et al. (2016)

익명 • 2026-01-14 • 조회수 46

기술 / 자연어처리 / 기계 번역

# Sennrich et al. (2016) ## 개요 Sennrich et al. (2016)은 자연어처리, 특히 **기계 번역**(Machine Translation, MT) 분야에서 중요한 전환점을 마련한 논문으로, **백워드 번역**(Back-Translat...

기계 번역 백워드 번역 BPE +2

BERT-Base

익명 • 2026-01-13 • 조회수 49

기술 / 자연어처리 / 대규모 언어 모델

# BERT-Base BERT-Base는 자연어 처리(NLP) 분야에서 혁신적인 전환을 가져온 **Bidirectional Encoder Representations from Transformers**(BERT) 모델의 기본 버전 중 하나로, 구글 연구팀에 의해 20...

BERT-Base 자연어처리 트랜스포머 +2

Sentence-BERT

익명 • 2026-01-12 • 조회수 37

기술 / 자연어처리 / 문장 임베딩

# Sentence-BERT ## 개요 **Sentence-BERT**(SBERT)는 문장 단위의 의미를 고정된 차원의 벡터(임베딩)로 효과적으로 표현하기 위해 개발된 자연어처리(NLP) 모델이다. 기존의 BERT 모델은 토큰 단위의 표현 능력은 뛰어나지만, 문장 ...

Sentence-BERT 문장 임베딩 Siamese Network +2

트랜스포머 기반 모델

익명 • 2026-01-07 • 조회수 37

기술 / 자연어처리 / 신경망 모델

# 트랜스포머 기반 모델 ## 개요 **트랜스포머 기반 모델**(Transformer-based model)은 자연어처리(NLP) 분야에서 혁신적인 전환을 이끈 딥러닝 아키텍처로, 2017년 구글의 연구팀이 발표한 논문 *"Attention Is All You Ne...

트랜스포머 자기 주의 메커니즘 대규모 언어 모델 +2

Self-Attention

익명 • 2026-01-06 • 조회수 39

기술 / 자연어처리 / 자기 주의 메커니즘

# Self-Attention Self-Attention은 자연어처리(NLP) 분야에서 핵심적인 역할을 하는 **자기 주의 메커니즘**(Self-Attention Mechanism)으로, 입력 시퀀스 내 각 위치의 단어(또는 토큰)가 다른 위치의 단어들과의 관계를 동...

Self-Attention Transformer 다중 헤드 어텐션 +2

FastText

익명 • 2026-01-03 • 조회수 34

기술 / 자연어처리 / 언어 모델

# FastText ## 개요 **FastText**는 페이스북 AI 연구소(Facebook AI Research, FAIR)에서 개발한 오픈소스 라이브러리로, 텍스트 분류와 단어 표현 학습을 위한 효율적인 자연어처리(NLP) 도구입니다. FastText는 전통적인...

FastText 서브워드 임베딩 텍스트 분류 +2

DPR

익명 • 2026-01-03 • 조회수 32

기술 / 자연어처리 / 정보 검색 기술

# DPR ## 개요 **DPR**(Dense Passage Retrieval)은 자연어처리(NLP) 분야에서 정보 검색(IR, Information Retrieval)을 위한 핵심 기술 중 하나로, 기존의 희소 표현 기반 검색 방식(예: BM25)을 보완하거나 대...

DPR 밀집 벡터 검색 BERT 기반 인코더 +2

KoNLPy

익명 • 2026-01-02 • 조회수 48

기술 / 자연어처리 / 도구

# KoNLPy ## 개요 **KoNLPy**(Korean Natural Language Processing for Python)는 한국어 자연어 처리(NLP)를 위한 파이썬 기반 라이브러리입니다. 이 라이브러리는 한국어 형태소 분석, 품사 태깅, 명사 추출, 키워...

KoNLPy 형태소 분석 품사 태깅 +2

가짜 뉴스 탐지

익명 • 2026-01-02 • 조회수 39

기술 / 자연어처리 / 신뢰성 평가

# 가짜 뉴스 탐지 ## 개요 가짜 뉴스 탐지(Fake News Detection)는 자연어처리(NLP, Natural Language Processing) 기술을 활용하여 허위 또는 왜곡된 정보를 포함한 뉴스 콘텐츠를 자동으로 식별하는 기술 분야입니다. 디지털 미...

가짜 뉴스 탐지 자연어처리 BERT +2