위키너와나

초기화

텍스트 정규화

익명 • 2026-06-20 • 조회수 0

기술 / 자연어처리 / 전처리

# 텍스트 정규화 (Text Normalization) **텍스트 정규화(Text Normalization)**는 자연어 처리(NLP) 파이프라인에서 원시 텍스트 데이터를 모델이 이해하고 처리하기 적합한 표준화된 형식으로 변환하는 전처리 과정입니다. 이는 텍스트 마이...

규칙 기반 방법

익명 • 2026-01-30 • 조회수 33

기술 / 자연어처리 / 전처리

# 규칙 기반 방법 자연어처리(Natural Language Processing, NLP)는 인간의 언어를 컴퓨터가 이해하고 분석할 수 있도록 하는 기술 분야이다. 이 과정에서 언어 데이터를 분석하기 전에 정제하고 구조화하는 단계인 **전처리**(preprocessi...

자연어처리 규칙 기반 방법 전처리 +2

계층적 소프트맥스

익명 • 2025-10-06 • 조회수 65

기술 / 자연어처리 / 전처리

# 계층적 소프맥스 ## 개요 **층적 소프맥스**(Hierarchicalmax)는 자연처리(NLP) 대용량 어휘(vocabulary)을룰 때 발생하는산 비용 문제를 해결하기 위해 제된 기술입니다 특히 언어 모델, 단어 임베딩(예: Word2Vec), 기계 번역 등...

계층적 소프트맥스 자연어처리 허프만 트리 +2

TF-IDF 가중 평균 임베딩

익명 • 2025-09-16 • 조회수 75

기술 / 자연어처리 / 전처리

# TF-IDF 가중 평균베딩 ## 개요 -IDF 가중 평균 임딩(TF-IDF Weighted Averageding)은 자연처리(NLP)에서나 문장의 의미를 수치터로 표현하기 위한 대표적인 기술 중 하나입니다. 방법은 단어 임베딩(word)과 TF-IDF(term-...

TF-IDF 가중치 임베딩 평균화 자연어처리 +2

불용어

익명 • 2025-09-15 • 조회수 72

기술 / 자연어처리 / 전처리

# 불용어 ## 개요 **용어**(Stopword)는 자연어처리(Natural Language Processing, NLP)에서 분석에 중요한 의미를 가지지 않는 것으로 간주되는 단어들을 말한다. 일반적으로 문장의 구조를 이루기 위해 자주 등장하지만, 실제 의미 분...

불용어 제거 자연어처리 전처리 +3

텍스트 데이터 필터링

익명 • 2025-09-15 • 조회수 113

기술 / 자연어처리 / 전처리

# 텍스트 데이터 필터링 ## 개요 텍스트 필터링(Text Data Filtering)은어처리(NLP, Natural Language)의 전처리 단계에서 핵심적인 역할을 하는 기술입니다. 이 과정은 원시 텍스트 데이터에서 분석이나 모델 학습에 불필요하거나 방해가 되...

텍스트 필터링 NLP 전처리 불용어 제거 +2

Vocabulary Augmentation

익명 • 2025-09-12 • 조회수 80

기술 / 자연어처리 / 전처리

# Vocabulary Augmentation 개요 **Vocabulary Augmentation어휘 증강)은 자연어(Natural Language Processing, N) 분야에서 언어 모델의 성능 향상을 위해 기존 어휘 집합(vocabulary)을 확장하거나...

어휘 증강 서브워드 토크나이제이션 OOV 문제 +2

공출현 행렬

익명 • 2025-09-12 • 조회수 61

기술 / 자연어처리 / 전처리

# 공출현 행렬 ## 개요 **공출 행렬**(Co-occurrence)은 자연어처리(Natural Language Processing, NLP) 분야에서 언어의 통계적 구조를 분석하고 단어 간의 의미적 관계를 모델링하는 데 핵심적으로 사용되는 데이터 구조이다. 이 ...

공출현 행렬 자연어처리 단어 임베딩 +2

스킵-그램

익명 • 2025-09-10 • 조회수 76

기술 / 자연어처리 / 전처리

# 스킵-그램 (-gram) ## 개요 스킵-그램(Skip-gram)은 자연어 처리(Natural Language Processing, NLP) 분야에서 널리 사용되는어 모델링 기법으로 **워드 임베딩**(Word Embedding) 생성하는 데 핵심적인 역할을 한...

스킵-그램 워드 임베딩 Word2Vec +4

Masked Language Model

익명 • 2025-09-07 • 조회수 115

기술 / 자연어처리 / 전처리

# Masked Language Model ##요 **Masked Language Model**(MLM, 마스크된 언어 모델)은 자연어 처리(NLP) 분야에서 대표적인 언어 모델링 기법 중 하나로, 입력 문장의 일부 단어를 임의로 "마스킹"하여, 모델이 해당 위치의...

Masked Language Model BERT 자연어처리 +2

Tokenization

익명 • 2025-09-04 • 조회수 84

기술 / 자연어처리 / 전처리

# Tokenization ## 개요 **토큰화(Tokenization)**는 자연어처리(Natural Language Processing, NLP)의 핵심 전처리 단계 중 하나로, 텍스트를 있는 단위인 **토큰**(Token)으로 나누는 과정을 의미합니다. 이 과...

토큰화 자연어처리 서브워드 토큰화 +2

요약

익명 • 2025-09-03 • 조회수 76

기술 / 자연어처리 / 전처리

# 요약 ## 개요 자연어처리(Natural Language, NLP)에서 **요약ummarization)**은 긴 텍스트의 핵심 정보를 간결하고 이해하기 쉬 형태로 재구하는 기술을 의미. 이는 문서,스 기사,고서, 연구 논문 등 다양한 텍스트 자료의 정보를 효율적...

요약 추출 기반 요약 생성 기반 요약 +6