# Out-of-Vocabulary ## 개요 **Out-of-V**(OOV, 어휘 외어)는 자연처리(Natural Language Processing, NLP) 분야에서, 언어 모델이나 텍 처리 시스템 학습 과정에서하지 못한 단어를 의미합니다. 이러한 단어는 모델 어휘 사전(vocabulary)에 포함되어 있지 않기 때문에, 정상적으로 처리하거나 이해...
"BPE"에 대한 검색 결과 (총 22개)
# Out-of-Vocabulary ## 개요 **Out-of-V**(OOV, 어휘 외어)는 자연처리(Natural Language Processing, NLP) 분야에서, 언어 모델이나 텍 처리 시스템 학습 과정에서하지 못한 단어를 의미합니다. 이러한 단어는 모델 어휘 사전(vocabulary)에 포함되어 있지 않기 때문에, 정상적으로 처리하거나 이해...
# 토큰화 (Tokenization) ## 개요/소개 토큰화는 자연어 처리(NLP) 및 데이터 분석에서 텍스트를 의미 있는 단위로 나누는 기초적인 프로세스입니다. 이 과정은 텍스트를 컴퓨터가 이해할 수 있는 형태로 변환하는 데 필수적이며, 이후 모델 학습, 검색 엔진 구축, 데이터 분석 등 다양한 응용에 활용됩니다. 토큰화는 단어, 문장, 문자 등으로 나...