# KoBERT **KoBERT**(Korean BERT)는 네이버 클라우드(Naver Cloud Platform)에서 개발한 한국어 기반의 사전 학습 언어 모델(Pre-trained Language Model)입니다. 기존 영어 중심의 BERT(Bidirectional Encoder Representations from Transformers) 모델을 ...
검색 결과
"언어 모델"에 대한 검색 결과 (총 208개)
# NLP (Natural Language Processing) **NLP**(Natural Language Processing, 자연어 처리)는 인공지능(AI)과 언어학의 교차 분야로, 컴퓨터가 인간의 자연 언어를 이해하고, 해석하며, 생성할 수 있도록 하는 기술을 포괄하는 개념입니다. 텍스트나 음성 형태의 방대한 데이터에서 의미 있는 정보를 추출하고,...
# Attention (어텐션) ## 개요 **어텐션(Attention)**, 한국어로는 **주의 메커니즘** 또는 **주의력**이라고도 불리는 이 개념은 자연어 처리(NLP) 분야에서 딥러닝 모델의 성능을 혁신적으로 향상시킨 핵심 기술입니다. 어텐션은 모델이 입력 시퀀스의 모든 부분 중에서 현재 출력이나 예측에 가장 관련성이 높은 부분에 '주의를 집중...
# BERT (Bidirectional Encoder Representations from Transformers) **BERT**(Bidirectional Encoder Representations from Transformers)는 구글(Google)이 2018년 10월 공개한 사전 학습(pre-training) 기반의 자연어 처리(NLP) 모델입니다...
# SBERT (Sentence-BERT) **SBERT**(Sentence-BERT)는 자연어 처리(NLP) 분야에서 문장 수준(Sentence-level)의 의미적 유사도(Semantic Similarity)를 측정하기 위해 최적화된 BERT 기반의 임베딩 모델입니다. 기존 BERT가 단어 단위나 문장 내 토큰 단위의 표현을 학습하는 데 중점을 둔 반...
# XSum (Extreme Summarization) **XSum**은 자연어 처리(NLP), 특히 텍스트 요약(Text Summarization) 분야에서 널리 사용되는 대규모 엔드투엔드(End-to-End) 요약 벤치마크 데이터셋입니다. 2018년 옥스퍼드 대학의 NLP 연구팀에 의해 공개된 이 데이터셋은 기존 요약 데이터셋들이 가진 한계를 극복하기...
# KoGPT **KoGPT**(Korean Generative Pre-trained Transformer)는 네이버 클라우드(Naver Cloud Platform)에서 개발한 한국어 특화 대규모 언어 모델(Large Language Model, LLM)입니다. 이 모델은 방대한 양의 한국어 텍스트 데이터를 기반으로 사전 학습(Pre-training)되어...
# Supervised Fine-tuning (지도 미세 조정) **Supervised Fine-tuning**(SFT, 지도 미세 조정)은 대규모 언어 모델(Large Language Model, LLM)이나 다른 딥러닝 모델을 특정 작업이나 도메인에 맞게 전문화시키기 위해, 레이블이 지정된 데이터셋을 사용하여 사전 학습된 모델의 가중치를 추가로 학습시...
# 서브워드 (Subword) **서브워드(Subword)**는 자연어 처리(Natural Language Processing, NLP) 분야에서 단어(Word)와 문자(Character)의 중간 단계에 해당하는 어휘 단위(Vocabulary Unit)를 의미합니다. 기존 단어 기반 토큰화(Tokenization) 방식이 가진 한계, 특히 희귀어 처리 문...
# 혼합 전문가 모델 (Mixture of Experts, MoE) ## 개요 **혼합 전문가 모델**(Mixture of Experts, 줄여서 **MoE**)은 대규모 언어 모델(LLM) 및 딥러닝 아키텍처에서 사용되는 효율적인 신경망 설계 패턴입니다. MoE의 핵심 아이디어는 단일 거대한 모델 대신, 여러 개의 작은 '전문가(Expert)' 네트워...
# 환각 (환각 현상) **환각**(幻覺, 영어: **Hallucination**)은 생성형 인공지능(Generative AI), 특히 대규모 언어 모델(Large Language Models, LLMs)이 사실과 다르거나 존재하지 않는 정보를 사실인 것처럼 생성해 내는 현상을 의미합니다. 이는 인공지능의 신뢰성을 해치는 주요한 결함 중 하나로, 모델이 ...
# 파괴적 망각 (Catastrophic Forgetting) 파괴적 망각은 연속 학습(Continual Learning) 환경에서 인공지능 모델이 새로운 작업을 학습하는 과정에서 기존 작업의 성능이 급격히 저하되는 현상을 의미합니다. 이는 인간 학습자가 새로운 지식을 습득하더라도 기존 지식을 완전히 잊지 않는 능력과 대비되는 머신러닝의 근본적인 한계 중...
# 머신러닝(Machine Learning) 머신러닝은 명시적인 프로그래밍 없이 컴퓨터가 데이터를 통해 스스로 학습하고 패턴을 인식하여 예측 또는 결정을 내리는 인공지능(AI)의 핵심 하위 분야입니다. ## 머신러닝의 개요와 정의 머신러닝은 아서 사무엘(Arthur Samuel)이 1959년 "컴퓨터가 특정 작업을 수행하기 위해 명시적인 명령어 없이 ...
# 환각 (Hallucination) **환각**(Hallucination, 줄여서 **Hallu**)은 인공지능, 특히 대규모 언어 모델(LLM)이 사실과 다르거나 존재하지 않는 정보를 확신에 차서 생성하는 현상을 의미합니다. 이는 인공지능의 신뢰성을 해치는 주요 장애물 중 하나로, 모델이 학습 데이터에 없는 사실을 마치 사실인 것처럼 지어내거나(Hal...
# 토큰 (Token) **토큰(Token)**은 컴퓨팅 및 언어 처리 분야에서 원시 데이터 스트림을 의미 있는 최소 단위인 '토큰'으로 분할하는 과정을 지칭합니다. 이는 주로 프로그래밍 언어의 컴파일 과정인 **렉싱(Lexing)**이나 자연어 처리(NLP)의 전처리 단계에서 핵심적인 역할을 수행합니다. 토큰은 문맥에 따라 문자, 단어, 구절, 또는 특...
# N-gram **N-gram**(엔그램)은 자연어 처리(Natural Language Processing, NLP) 및 통계적 언어 모델링에서 사용되는 연속된 단어(또는 문자)의 시퀀스입니다. 여기서 'N'은 시퀀스의 길이를 나타내는 정수 변수로, N=1일 때는 **유니그램(Unigram)**, N=2일 때는 **바이그램(Bigram)**, N=3일 ...
# LAMB (Layer-wise Adaptive Moments optimizer for Batch normalization) **LAMB**(Layer-wise Adaptive Moments optimizer for Batch normalization)는 대규모 배치 학습(Batch Training) 환경에서 효율적으로 딥러닝 모델을 최적화하기 위해 설...
# 리버스 엔지니어링 리버스 엔지니어링(Reverse Engineering)은 완성된 제품이나 소프트웨어의 구조, 동작 원리, 설계 정보를 분석하여 그 내부 논리를 역으로 파악하는 **분석 및 이해 과정**입니다. 이를 통해 얻은 지식을 바탕으로 새로운 개발, 유지보수, 보안 분석, 호환성 확보 등에 활용됩니다. ## 리버스 엔지니어링의 개요와 정의 ...
# Adapter 모듈 ## 개요 **Adapter 모듈**(Adapter Module)은 사전 학습된 대규모 인공지능 모델(Transformer, Vision Transformer 등)에 경량의 trainable 레이어를 삽입하여 **파라미터 효율적 미세 조정(Parameter-Efficient Fine-Tuning, PEFT)**을 가능하게 하는 구조...
# ELECTRA ## 개요 **ELECTRA**(Efficiently Learning an Encoder that Classifies Token Replacements Accurately)는 2020년 구글 리서치(Google Research) 팀이 제안한 자연어 처리(NLP) 기반 사전 학습(pre-training) 방법론입니다. 기존 BERT 모델에...