위키너와나

SBERT

기술 > 자연어처리 > 문장 임베딩 | 익명 | 2026-06-20 | 조회수 2

# SBERT (Sentence-BERT) **SBERT**(Sentence-BERT)는 자연어 처리(NLP) 분야에서 문장 수준(Sentence-level)의 의미적 유사도(Semantic Similarity)를 측정하기 위해 최적화된 BERT 기반의 임베딩 모델입니다. 기존 BERT가 단어 단위나 문장 내 토큰 단위의 표현을 학습하는 데 중점을 둔 반...

#SBERT #Sentence-BERT #자연어처리 #NLP #문장임베딩 #의미적유사도 #SiameseNetwork #HuggingFace #SentenceTransformers #FAISS

RBMT

기술 > 자연어 처리 > 기계 번역 | 익명 | 2026-06-20 | 조회수 0

# RBMT (Rule-Based Machine Translation) **RBMT**(Rule-Based Machine Translation, 규칙 기반 기계 번역)는 자연어 처리(NLP) 분야에서 초기부터 사용되어 온 기계 번역 방식 중 하나입니다. 이 방법은 컴퓨터 프로그래머와 언어학자가 직접 개발한 언어학적 규칙과 사전(Dictionary)을 사용...

#RBMT #규칙 기반 기계 번역 #자연어 처리 #기계 번역 #형태소 분석 #통사 분석 #신경망 기계 번역 #하이브리드 시스템 #저자원 언어

XSum

기술 > 자연어처리 > 벤치마크 | 익명 | 2026-06-20 | 조회수 1

# XSum (Extreme Summarization) **XSum**은 자연어 처리(NLP), 특히 텍스트 요약(Text Summarization) 분야에서 널리 사용되는 대규모 엔드투엔드(End-to-End) 요약 벤치마크 데이터셋입니다. 2018년 옥스퍼드 대학의 NLP 연구팀에 의해 공개된 이 데이터셋은 기존 요약 데이터셋들이 가진 한계를 극복하기...

#XSum #텍스트 요약 #생성식 요약 #NLP #벤치마크 데이터셋 #ROUGE #BERTScore #BBC 뉴스 #단문 요약 #LLM

KoGPT

기술 > 인공지능 > 언어 모델링 | 익명 | 2026-06-20 | 조회수 0

# KoGPT **KoGPT**(Korean Generative Pre-trained Transformer)는 네이버 클라우드(Naver Cloud Platform)에서 개발한 한국어 특화 대규모 언어 모델(Large Language Model, LLM)입니다. 이 모델은 방대한 양의 한국어 텍스트 데이터를 기반으로 사전 학습(Pre-training)되어...

#KoGPT #네이버클라우드 #대규모언어모델 #LLM #한국어특화 #트랜스포머 #RAG #자연어처리 #API #AI비즈니스

Viterbi Algorithm

기술 > 알고리즘 > 시퀀스 추론 | 익명 | 2026-06-20 | 조회수 0

# 비터비 알고리즘 (Viterbi Algorithm) **비터비 알고리즘**(Viterbi Algorithm)은 가장 가능성이 높은 상태 시퀀스(최우경로)를 찾기 위한 동적 계획법(Dynamic Programming) 기반의 알고리즘입니다. 주로 은닉 마르코프 모델(Hidden Markov Model, HMM)과 같은 확률적 모델에서 관찰된 시퀀스 데이...

#비터비 알고리즘 #동적 계획법 #은닉 마르코프 모델 #HMM #시퀀스 추론 #자연어 처리 #음성 인식 #생정보학

채용 추천

경제 > 비즈니스 > 인사 관리 | 익명 | 2026-06-20 | 조회수 2

# 채용 추천 (Recruitment Recommendation) ## 개요 **채용 추천(Recruitment Recommendation)**은 기업이나 조직이 최적의 인재를 선발하기 위해 다양한 데이터, 알고리즘, 그리고 전문가의 판단을 활용하여 지원자를 평가하고 적합한 후보를 선별하는 과정을 의미합니다. 전통적인 채용 방식이 주로 이력서와 면접을 ...

#채용 추천 #인공지능 #인적자원 관리 #HRM #데이터 기반 채용 #알고리즘 편향 #자연어 처리 #채용 프로세스

인공지능

기술 > 인공지능 > 확률적 모델 | 익명 | 2026-06-20 | 조회수 0

# 인공지능: 확률적 모델과 현대 AI의 기초 ## 개요 **인공지능(Artificial Intelligence, AI)**은 인간의 지능적 행위를 모방하여 문제를 해결하거나 결정을 내릴 수 있는 컴퓨터 시스템이나 소프트웨어를 포괄하는 광범위한 기술 분야입니다. 초기에는 논리적 추론과 규칙 기반 시스템에 중점을 두었으나, 21세기에 들어서는 데이터의 양...

#인공지능 #확률적 모델 #머신러닝 #딥러닝 #베이지안 네트워크 #불확실성 #생성 모델 #판별 모델 #중급

IBM

기술 > 기업 > IBM | 익명 | 2026-06-20 | 조회수 0

# IBM **IBM**(International Business Machines Corporation, 국제 비즈니스 머신즈)는 미국의 다국적 기업으로, 기업용 컴퓨터, 소프트웨어, 클라우드 컴퓨팅, 인공지능(AI) 및 컨설팅 서비스를 제공하는 글로벌 기술의 선두주자입니다. 본사는 뉴욕주 아몬크에 위치해 있으며, 역사적으로 메인프레임 컴퓨터의 개발과 상...

#IBM #하이브리드 클라우드 #Red Hat #왓슨 #양자 컴퓨팅 #엔터프라이즈 IT #기술 기업

서브워드

기술 > 자연어처리 > 어휘 구조 | 익명 | 2026-06-20 | 조회수 0

# 서브워드 (Subword) **서브워드(Subword)**는 자연어 처리(Natural Language Processing, NLP) 분야에서 단어(Word)와 문자(Character)의 중간 단계에 해당하는 어휘 단위(Vocabulary Unit)를 의미합니다. 기존 단어 기반 토큰화(Tokenization) 방식이 가진 한계, 특히 희귀어 처리 문...

#서브워드 #토큰화 #자연어처리 #NLP #BPE #WordPiece #Unigram #SentencePiece #LLM #중급

catastrophic forgetting

기술 > 인공지능 > 머신러닝 | 익명 | 2026-06-16 | 조회수 11

# 파괴적 망각 (Catastrophic Forgetting) 파괴적 망각은 연속 학습(Continual Learning) 환경에서 인공지능 모델이 새로운 작업을 학습하는 과정에서 기존 작업의 성능이 급격히 저하되는 현상을 의미합니다. 이는 인간 학습자가 새로운 지식을 습득하더라도 기존 지식을 완전히 잊지 않는 능력과 대비되는 머신러닝의 근본적인 한계 중...

#파괴적 망각 #연속 학습 #머신러닝 #딥러닝 #EWC #SI #Replay Buffer #가소성-안정성 딜레마

머신러닝

기술 > 인공지능 > 머신러닝 | 익명 | 2026-06-14 | 조회수 9

# 머신러닝(Machine Learning) 머신러닝은 명시적인 프로그래밍 없이 컴퓨터가 데이터를 통해 스스로 학습하고 패턴을 인식하여 예측 또는 결정을 내리는 인공지능(AI)의 핵심 하위 분야입니다. ## 머신러닝의 개요와 정의 머신러닝은 아서 사무엘(Arthur Samuel)이 1959년 "컴퓨터가 특정 작업을 수행하기 위해 명시적인 명령어 없이 ...

#머신러닝 #인공지능 #딥러닝 #지도학습 #비지도학습 #강화학습 #선형회귀 #SVM #의사결정나무 #과적합

리니어ReLU

기술 > 인공지능 > 머신러닝 | 익명 | 2026-06-13 | 조회수 3

# 리니어ReLU (LinearReLU) **리니어ReLU(LinearReLU)**는 인공 신경망(Artificial Neural Networks)에서 활성화 함수(Activation Function)로 사용되는 수학적 연산자입니다. 이 함수는 입력값이 양수일 경우 선형적으로 값을 전달하고, 음수일 경우 0으로 고정하는 **ReLU(Rectified Li...

#딥러닝 #활성화함수 #ReLU #LeakyReLU #PyTorch #그래디언트소실 #신경망

토큰

기술 > 컴퓨터과학 > 구문 분석 | 익명 | 2026-06-13 | 조회수 1

# 토큰 (Token) **토큰(Token)**은 컴퓨팅 및 언어 처리 분야에서 원시 데이터 스트림을 의미 있는 최소 단위인 '토큰'으로 분할하는 과정을 지칭합니다. 이는 주로 프로그래밍 언어의 컴파일 과정인 **렉싱(Lexing)**이나 자연어 처리(NLP)의 전처리 단계에서 핵심적인 역할을 수행합니다. 토큰은 문맥에 따라 문자, 단어, 구절, 또는 특...

#토큰 #토큰화 #자연어처리 #NLP #렉싱 #컴파일러 #서브워드 #BPE #WordPiece #컨텍스트 윈도우

순환 신경망

기술 > 인공지능 > 머신러닝 | 익명 | 2026-06-13 | 조회수 1

# 순환 신경망 (Recurrent Neural Network, RNN) ## 개요 **순환 신경망**(Recurrent Neural Network, 약자 **RNN**)은 인공 신경망의 한 종류로, 시계열 데이터나 연속된 데이터 시퀀스를 처리하는 데 특화된 아키텍처입니다. 기존 전진 신경망(Feedforward Neural Network)이 입력과 출...

#순환 신경망 #RNN #LSTM #GRU #시계열 데이터 #자연어 처리 #딥러닝 #기울기 소실 #트랜스포머

GRU

기술 > 인공지능 > 순환 신경망 | 익명 | 2026-06-13 | 조회수 1

# GRU (Gated Recurrent Unit) **GRU**(Gated Recurrent Unit, 게이트드 리커런트 유닛)는 순환 신경망(RNN, Recurrent Neural Network)의 한 변형 모델로, 장기 의존성 문제(Long-term Dependency Problem)를 해결하기 위해 설계된 알고리즘입니다. 2014년 키라(Kyung...

#GRU #순환 신경망 #LSTM #딥러닝 #자연어 처리 #시계열 예측 #게이트드 리커런트 유닛 #인공지능

n-gram

기술 > 자연어처리 > 언어 단위 | 익명 | 2026-06-13 | 조회수 6

# N-gram **N-gram**(엔그램)은 자연어 처리(Natural Language Processing, NLP) 및 통계적 언어 모델링에서 사용되는 연속된 단어(또는 문자)의 시퀀스입니다. 여기서 'N'은 시퀀스의 길이를 나타내는 정수 변수로, N=1일 때는 **유니그램(Unigram)**, N=2일 때는 **바이그램(Bigram)**, N=3일 ...

#N-gram #자연어처리 #언어모델 #바이그램 #트라이그램 #라플라스평활화 #Transformer #기계번역 #음성인식 #초급

Conditional Random Fields

기술 > 머신러닝 > 분류 알고리즘 | 익명 | 2026-05-16 | 조회수 54

# Conditional Random Fields (CRF) ## 개요 **Conditional Random Fields(CRF)**는 구조화된 예측(structured prediction) 문제를 해결하기 위해 설계된 디스크리미네이티브(discreminative) 확률 그래프 모델입니다. 주로 시퀀스 데이터의 각 요소에 레이블을 할당하는 작업(예: 개체...

#조건부 랜덤 필드 #시퀀스 레이블링 #구조화 예측 #Viterbi 알고리즘 #자연어 처리 #sklearn-crfsuite #고급 머신러닝

XGBoost

기술 > 머신러닝 > 앙상블 방법 | 익명 | 2026-04-18 | 조회수 42

# XGBoost ## 개요 **XGBoost**(Extreme Gradient Boosting)는 효율적이고 확장 가능한 그래디언트 부스팅 라이브러리로, Tianqi Chen과 공동 연구진에 의해 2014년 공개되었습니다. 데이터 과학 경진대회(Kaggle 등)와 산업 현장 모두에서 높은 예측 성능과 학습 속도로 널리 사용되고 있으며, 현재까지 머신러닝...

#XGBoost #그래디언트 부스팅 #앙상블 학습 #정규화 기법 #예측 모델링 #Python

ELECTRA

기술 > 인공지능 > 머신러닝 | 익명 | 2026-04-17 | 조회수 22

# ELECTRA ## 개요 **ELECTRA**(Efficiently Learning an Encoder that Classifies Token Replacements Accurately)는 2020년 구글 리서치(Google Research) 팀이 제안한 자연어 처리(NLP) 기반 사전 학습(pre-training) 방법론입니다. 기존 BERT 모델에...

#ELECTRA #자연어처리 #사전학습 #트랜스포머 #생성판별프레임워크 #BERT #경량화모델

zero-shot 분류

기술 > 인공지능 > 전이 학습 | 익명 | 2026-04-16 | 조회수 20

# Zero-Shot 분류 ## 개요 Zero-shot 분류(Zero-Shot Classification, ZSC)는 머신러닝 및 인공지능 분야에서 훈련 데이터에 포함되지 않은 새로운 클래스를 식별하고 범주화하는 기술입니다. 기존 지도 학습이 레이블이 명시된 데이터를 통해 모델을 최적화하는 것과 달리, zero-shot 분류는 모델이 테스트 시점에 처음 ...

#Zero-Shot 분류 #전이 학습 #다모달 인공지능 #CLIP 모델 #대조 학습 #프롬프트 엔지니어링 #고급

검색 결과