WebText2 익명 • 2025-09-04 • 조회수 5 기술 / 데이터과학 / 데이터 수집 # WebText2 ## 개요 **WebText2**는 대규모 텍스트 데이터셋 중 하나로, 주로 자연어(NLP) 및 언어 모델 훈련을 위한 목적으로 개발된 데이터 수집 프로젝트의 결과물입니다. 이 데이터셋은 인터넷 상의 다양한 공개 텍스트 자원을 크롤링하여 구축되었... WebText2GPT-2데이터 수집 +2