위키너와나

언어 모델링

기술 > 자연어처리 > 언어 모델링 | 익명 | 2025-09-29 | 조회수 49

# 언어 모델링 ## 개요 **언어 모델링**(Language Modeling)은 자연어처리(NLP, Natural Language Processing)의심 기술 중 하나, 주어진어 시퀀스(문장 또는 문맥)가 자연스러운 언어로 구성될 확률을 계산하는 작업을 말합니다. 즉, 언어 모델은 "어떤 문장이 인간 언어로 얼마나 자연스러운가?"를 수학적으로 평가하...

#언어 모델링 #트랜스포머 #n-그램 #퍼플렉서티 #대규모 언어 모델

사전 학습

기술 > 머신러닝 > 전이 학습 | 익명 | 2026-06-20 | 조회수 2

# 사전 학습 (Pre-training) **사전 학습**(Pre-training)은 머신러닝, 특히 딥러닝 분야에서 방대한 양의 데이터로부터 모델의 초기 가중치(Weight)와 편향(Bias)을 학습하는 과정을 의미합니다. 이는 주로 **전이 학습**(Transfer Learning)의 핵심 단계로 활용되며, 특정 태스크(Task)에 대한 미세 조정(F...

#사전 학습 #딥러닝 #전이 학습 #BERT #GPT #자기지도학습 #자연어 처리 #컴퓨터 비전

은닉 마르코프 모델

기술 > 자연어처리 > 자연어처리 접근 방식 | 익명 | 2026-06-20 | 조회수 5

# 은닉 마르코프 모델 (Hidden Markov Model, HMM) ## 개요 **은닉 마르코프 모델**(Hidden Markov Model, 약자 **HMM**)은 통계적 확률 모델의 일종으로, 관찰할 수 없는(은닉된) 상태들이 마르코프 성질을 따르며, 이 상태들이 관찰 가능한 출력 신호를 생성한다고 가정하는 모델입니다. 자연어 처리(NLP), 음...

#은닉 마르코프 모델 #HMM #자연어 처리 #확률 모델 #비터비 알고리즘 #바움-웰치 알고리즘 #시퀀스 데이터 #중급

n-gram

기술 > 자연어처리 > 언어 단위 | 익명 | 2026-06-13 | 조회수 7

# N-gram **N-gram**(엔그램)은 자연어 처리(Natural Language Processing, NLP) 및 통계적 언어 모델링에서 사용되는 연속된 단어(또는 문자)의 시퀀스입니다. 여기서 'N'은 시퀀스의 길이를 나타내는 정수 변수로, N=1일 때는 **유니그램(Unigram)**, N=2일 때는 **바이그램(Bigram)**, N=3일 ...

#N-gram #자연어처리 #언어모델 #바이그램 #트라이그램 #라플라스평활화 #Transformer #기계번역 #음성인식 #초급

ELECTRA

기술 > 인공지능 > 머신러닝 | 익명 | 2026-04-17 | 조회수 25

# ELECTRA ## 개요 **ELECTRA**(Efficiently Learning an Encoder that Classifies Token Replacements Accurately)는 2020년 구글 리서치(Google Research) 팀이 제안한 자연어 처리(NLP) 기반 사전 학습(pre-training) 방법론입니다. 기존 BERT 모델에...

#ELECTRA #자연어처리 #사전학습 #트랜스포머 #생성판별프레임워크 #BERT #경량화모델

사전 학습

기술 > 인공지능 > 모델 훈련 | 익명 | 2026-04-16 | 조회수 27

# 사전 학습 (Pre-training) ## 개요 사전 학습(Pre-training)은 인공지능, 특히 딥러닝 모델 개발 파이프라인에서 가장 초기이자 핵심적인 단계로, 방대한 양의 일반 데이터셋을 활용하여 모델이 세계에 대한 기본적인 지식과 패턴을 학습시키는 과정입니다. 이 단계에서 훈련된 모델은 특정 작업에 최적화되지 않은 '기반 모델(Foundati...

#사전학습 #딥러닝 #자기지도학습 #트랜스포머 #파인튜닝 #고급

BERT

기술 > 자연어처리 > 임베딩 | 익명 | 2026-04-09 | 조회수 18

# BERT ## 개요 **BERT**(Bidirectional Encoder Representations from Transformers)는 자연어 처리(NLP) 분야에서 혁신적인 영향을 미친 언어 모델로, 2018년 구글(Google) 연구팀에 의해 개발되었습니다. BERT는 기존의 단방향 언어 모델과 달리 **양방향 맥락**(bidirectiona...

#BERT #자연어처리 #트랜스포머 #사전학습모델 #MLM #NSP #파인튜닝 #임베딩 #중급

CBOW

기술 > 인공지능 > 임베딩 | 익명 | 2026-03-04 | 조회수 67

# CBOW (Continuous Bag‑of‑Words) 모델 ## 개요 CBOW(Continuous Bag‑of‑Words)는 **워드 임베딩(word embedding)**을 학습하기 위한 대표적인 신경망 모델 중 하나이며, **Word2Vec** 프레임워크에서 제시된 두 가지 기본 아키텍처(다른 하나는 Skip‑gram) 중 첫 번째 모델이다. ...

#CBOW #Word2Vec #Word Embedding #Gensim #Negative Sampling #Skip-gram #FastText #Context Window

GPT-3.5

기술 > 인공지능 > 대규모 언어 모델 | 익명 | 2026-01-22 | 조회수 30

# GPT-3.5 ## 개요 GPT-3.5는 OpenAI에서 개발한 대규모 언어 모델(Large Language Model, LLM)로, GPT-3 이후의 개선 버전에 해당하는 모델군을 지칭합니다. 정식 명칭은 공개되지 않았으나, OpenAI의 API 및 제품에서 사용되는 모델 중 하나로, 특히 **ChatGPT의 초기 버전**에 기반을 두고 있습니다....

#GPT-3.5 #트랜스포머 아키텍처 #RLHF #자연어 처리 #대규모 언어 모델

개체명 인식

기술 > 자연어 처리 > 언어 모델링 | 익명 | 2026-01-11 | 조회수 40

# 개체명 인식 ## 개요 **개체명 인식**(Named Entity Recognition, 이하 NER)은 자연어 처리(Natural Language Processing, NLP) 분야의 핵심 기술 중 하나로, 텍스트 내에 등장하는 특정 유형의 명명된 실체(named entities)를 식별하고 분류하는 작업입니다. 예를 들어, "서울은 대한민국의 수...

#개체명 인식 #NER #자연어 처리 #NLP #프리트레인드 언어 모델 #Bi-LSTM #CRF #한국어 NER

FastText

기술 > 자연어처리 > 언어 모델 | 익명 | 2026-01-03 | 조회수 37

# FastText ## 개요 **FastText**는 페이스북 AI 연구소(Facebook AI Research, FAIR)에서 개발한 오픈소스 라이브러리로, 텍스트 분류와 단어 표현 학습을 위한 효율적인 자연어처리(NLP) 도구입니다. FastText는 전통적인 단어 임베딩 기법인 **Word2Vec**과 유사한 구조를 가지면서도, 단어를 구성하는 ...

#FastText #서브워드 임베딩 #텍스트 분류 #Word2Vec #자연어처리

SentencePiece

기술 > 자연어처리 > 언어 모델링 | 익명 | 2025-11-23 | 조회수 72

# SentencePiece ## 개요 **SentencePiece**는 구글이 개발한 오픈소스 자연어 처리(NLP) 라이브러리로, 언어 모델링 및 기계 번역 작업에서 사용되는 **서브워드 토크나이제이션**(subword tokenization) 기법을 구현하는 도구입니다. 기존의 단어 기반 또는 문자 기반 토크나이제이션 방식의 한계를 극복하기 위해 설...

#SentencePiece #서브워드 토크나이제이션 #BPE #Unigram Language Model #자연어처리

RNN

기술 > 딥러닝 > 신경망 모델 | 익명 | 2025-10-19 | 조회수 93

# RNN (Recurrent Neural Network) ## 개요 **RNN**(Recurrent Neural Network, 순환 신경망)은 시계열 데이터나 순적 데이터(sequence data)를 처리하기 위해 설계된 딥러 기반 신경망 모델입니다. 일반적인 피포워드 신경망(Feed Neural Network)이 입력 데이터를 독립적인 단위로 간주...

#RNN #LSTM #GRU #순환 신경망 #시계열 데이터 #기울기 소실 #트랜스포머 #자연어 처리 #딥러닝

임베딩 계층

기술 > 인공지능 > 임베딩 | 익명 | 2025-10-02 | 조회수 64

# 임베딩 계층## 개요 **임베 계층**(Embedding Layer)은 인공지능, 특히 자연어(NLP)와천 시스템 등에서 범주형 데이터를 고차원 실수 벡터로 변환하는 핵심적인 신경망 구성 요소입니다.로 단어, 토큰, 사용자 ID, 상품 카테고리와 같은 이산적(discrete)이고 정수로 표현되는 입력값을 밀집된(dense) 실수 벡터 형태로 매핑하여,...

#임베딩 계층 #자연어 처리 #신경망 #PyTorch #Transformer

사전 학습

기술 > 인공지능 > 머신러닝 | 익명 | 2025-10-01 | 조회수 59

# 사전 학습 **사전 학습**(Pre-training) 머신러닝, 특히 딥닝 분야에서리 사용되는 학습 전략으로, 모델이 특정 작업에 본격적으로 적용되기 전에 방대한 양의 일반적인 데이터를 통해 기본적인 지식이나 표현 능력을 습득하는 과정을 의미합니다. 이 방법은 주어진 과제(예: 텍스트 분류, 이미지 인식)에 대한 **전이 학습**(Transfer Le...

#사전 학습 #전이 학습 #자기 지도 학습 #BERT #비지도 학습

NLTK

기술 > 자연어처리 > 자연어처리 도구 | 익명 | 2025-09-20 | 조회수 77

# NLTK ## 개요 NLTK(Natural Language Toolkit는 자연어 처리(Natural Language Processing, NLP)를 위한 파이 기반의 강한 오픈소스 라이브러리입니다.2001년 스티븐 반드레브(Steven Bird), 에반 클라이너(Ewan Klein), 에드워드 로프터스(Edward Loper) 등에 의해 개발되었으...

#NLTK #자연어처리 #파이썬 라이브러리 #토큰화 #품사 태깅 #스템밍 #표제어 추출 #불용어 제거 #초급

BERT

기술 > 인공지능 > 머신러닝 | 익명 | 2025-09-17 | 조회수 77

# BERT ## 개요 **BERT**(Bidirectional Encoder Represent from Transformers)는어 처리(NLP)야에서 혁신적인과를 이룬러닝 기반 언어 모델로, 구글(Google) 연구팀이 2018년에 발표한 머신러닝 모델이다. BERT는 이전의 단방향 언어 모델들과 달리 **양방향 컨텍스트**(Bidirectional...

#BERT #트랜스포머 #자연어 처리 #사전 훈련 모델 #MLM

Bidirectional Encoder Representations from Transformers

기술 > 자연어처리 > 언어 모델링 | 익명 | 2025-09-17 | 조회수 73

# Bidirectional Encoder Represent from Transformers ## 개요 **Bid Encoder Representations from Transformers**(BERT는 자연어 처리(NLP) 분야 혁신적인 성를 이룬 언어델로, 018년글(Google) 연구에 의해 개발. BERT는 이전의 단방향 언어 모델들(예: GPT...

#BERT #트랜스포머 #양방향 문맥 #MLM #NSP

N-그램

기술 > 자연어처리 > 언어 모델링 | 익명 | 2025-09-15 | 조회수 128

# N-그램## 개요 **N-그램**(N-gram)은어처리(Natural Language Processing, NLP) 분야에서 언어 모델(Language Modeling)에리 사용되는 기초적인 통계적 기법이다. N-램은 연속 N개의 아이템(item)으로 구성된 부분열을 의미하며, 언어 처리에서는 주로 연속된 N개 단어(word) 또는 음소(phoneme...

#N-그램 #언어 모델링 #자연어처리 #마르코프 가정 #스무딩 기법

Global Vectors for Word Representation

기술 > 자연어처리 > 언어 모델링 | 익명 | 2025-09-10 | 조회수 72

# Global Vectors for Word Representation**Global Vectors for Word RepresentationGloVe) 단어를 고차 벡터 공간에 표현하는 대표적인 **언어 모델링 기법** 중 하나로, 단어 간의 의미적 관계를 수치적으로 포착하는 데 목적을 둔다. GloVe는 분포 가설(Distributional Hypot...

#GloVe #단어 임베딩 #자연어처리 #동시 등장 행렬 #분포 가설

검색 결과