검색 결과

"하위 단어"에 대한 검색 결과 (총 4개)

NLTK

기술 > 자연어처리 > 자연어처리 도구 | 익명 | 2025-09-20 | 조회수 34

# NLTK ## 개요 NLTK(Natural Language Toolkit는 자연어 처리(Natural Language Processing, NLP)를 위한 파이 기반의 강한 오픈소스 라이브러리입니다.2001년 스티븐 반드레브(Steven Bird), 에반 클라이너(Ewan Klein), 에드워드 로프터스(Edward Loper) 등에 의해 개발되었으...

Byte Pair Encoding

기술 > 자연어처리 > 토큰화 | 익명 | 2025-09-10 | 조회수 32

# Byte Pair Encoding **Byte Pair Encoding**(BPE, 바이 쌍 인코딩)은 자연 처리(NLP) 분야에서 널리 사용되는 하위 단어(Subword) 토큰화 기법 중 하나로, 언어 어휘를 고정된 크기의 어휘 집합(Vocabulary)으로 효율적으로 압축하고, 미등록 단어(Out-of-Vocabulary, OOV) 문제를 완화하는...