# 사전 학습 (Pre-training) **사전 학습**(Pre-training)은 머신러닝, 특히 딥러닝 분야에서 방대한 양의 데이터로부터 모델의 초기 가중치(Weight)와 편향(Bias)을 학습하는 과정을 의미합니다. 이는 주로 **전이 학습**(Transfer Learning)의 핵심 단계로 활용되며, 특정 태스크(Task)에 대한 미세 조정(F...
검색 결과
"NeurIPS"에 대한 검색 결과 (총 39개)
# NIPS (Neural Information Processing Systems) **NIPS**(Neural Information Processing Systems)는 인공지능(AI), 머신러닝, 통계학, 그리고 관련 분야의 최전선 연구 성과를 공유하고 논의하는 세계 최대 규모의 국제 학술 대회 중 하나입니다. 원래는 'Neural Informatio...
# 집단별 성능 지표 (Stratified Performance Metrics) ## 개요 **집단별 성능 지표(Stratified Performance Metrics)**는 머신러닝 및 데이터 과학 모델의 평가 과정에서 전체 데이터셋의 평균 성능만으로는 파악하기 어려운 하위 그룹(Sub-group) 간의 성능 편차(Disparity)를 정량화하기 위해...
# 잔차 연결 (Residual Connection) ## 개요 **잔차 연결**(Residual Connection), 또는 **잔차 학습**(Residual Learning)은 심층 신경망(Deep Neural Network)의 학습 효율성을 획기적으로 개선하기 위해 도입된 핵심 기법입니다. 이 개념은 특히 **딥러닝(Deep Learning)** ...
# Attention (어텐션) ## 개요 **어텐션(Attention)**, 한국어로는 **주의 메커니즘** 또는 **주의력**이라고도 불리는 이 개념은 자연어 처리(NLP) 분야에서 딥러닝 모델의 성능을 혁신적으로 향상시킨 핵심 기술입니다. 어텐션은 모델이 입력 시퀀스의 모든 부분 중에서 현재 출력이나 예측에 가장 관련성이 높은 부분에 '주의를 집중...
# Supervised Fine-tuning (지도 미세 조정) **Supervised Fine-tuning**(SFT, 지도 미세 조정)은 대규모 언어 모델(Large Language Model, LLM)이나 다른 딥러닝 모델을 특정 작업이나 도메인에 맞게 전문화시키기 위해, 레이블이 지정된 데이터셋을 사용하여 사전 학습된 모델의 가중치를 추가로 학습시...
# 그래프 신경망 (Graph Neural Networks) **그래프 신경망**(Graph Neural Networks, **GNN**)은 그래프 구조의 데이터를 직접 처리하고 학습할 수 있는 딥러닝 모델의 한 종류입니다. 기존 합성곱 신경망(CNN)이 정방형 그리드 구조(이미지)나 시계열 데이터(RNN)에 특화되어 있다면, GNN은 노드(Node)와 ...
# ELECTRA ## 개요 **ELECTRA**(Efficiently Learning an Encoder that Classifies Token Replacements Accurately)는 2020년 구글 리서치(Google Research) 팀이 제안한 자연어 처리(NLP) 기반 사전 학습(pre-training) 방법론입니다. 기존 BERT 모델에...
# Concrete Dropout ## 개요 **Concrete Dropout**는 심층 신경망에서 드롭아웃(Dropout)의 비율을 고정된 하이퍼파라미터가 아닌 학습 가능한 파라미터로 자동 최적화하는 머신러닝 기법입니다. 2017년 Alexey Gal과 Zoubin Ghahramani가 제안한 이 방법은 베이지안 신경망(Bayesian Neural Ne...
# 딥러닝 기반 방법 ## 개요 딥러닝 기반 방법은 머신러닝의 한 분야로, 인공신경망(Artificial Neural Networks, ANN)의 다층 구조를 활용하여 데이터에서 복잡한 패턴과 특징을 자동으로 학습하는 기술입니다. 특히 깊은 네트워크 구조(즉, 여러 개의 은닉층을 가진 구조)를 사용함으로써 기존의 머신러닝 기법들이 해결하기 어려웠던 고차...
# 맥락 의존성 ## 개요 **맥락 의존성**(Context Dependency)은 자연어처리(Natural Language Processing, NLP) 분야에서 언어의 의미가 단어나 문장 자체보다는 그 주변의 언어적 또는 비언어적 맥락에 따라 달라질 수 있다는 개념을 의미한다. 인간 언어는 고도로 맥락에 의존적이며, 동일한 표현이 상황에 따라 완전히...
# LightGBM LightGBM은 마이크로소프트에서 개발한 고성능의 경량 그래디언트 부스팅 프레임워크로, 대규모 데이터셋에서도 빠르고 효율적인 학습을 가능하게 하는 머신러닝 알고리즘입니다. 특히 분류, 회귀, 순위 예측 등 다양한 머신러닝 과제에서 뛰어난 성능을 보이며, XGBoost, CatBoost 등과 함께 대표적인 그래디언트 부스팅 트리(Gra...
# Sennrich et al. (2016) ## 개요 Sennrich et al. (2016)은 자연어처리, 특히 **기계 번역**(Machine Translation, MT) 분야에서 중요한 전환점을 마련한 논문으로, **백워드 번역**(Back-Translation)과 **서브워드 유닛**(Subword Units) 기반의 **바이트 페어 인코딩*...
# XSum ## 개요 **XSum**은 자연어처리(NLP) 분야에서 특히 **문서 요약**(text summarization) 연구에 널리 사용되는 영어 기반의 대규모 요약 데이터셋입니다. 이 데이터셋은 BBC 뉴스 기사를 원본 텍스트로, 기사의 핵심 내용을 담은 매우 짧은 요약문을 정답(label)으로 구성하고 있으며, **추출형 요약**(extra...
# Exploring the Limits Transfer Learning ## 개요 **전 학습**(Transfer Learning) 한 도메인 작업에서 학습한식을 다른 관련메인이나 새로운에 적용하는 기계 학습의 핵심 기법입니다. 특히 대모 언어 모델(Large Language Models, LLMs)의 발전과 함께 전이 학습은 자연어 처리(NLP) 분...
자동 라벨 ## 개요**자동 라벨링**(Autoing)은 머신러닝 및 데이터 과학 분야에서 대량의 데이터에 빠르고 효율적으로이블(label)을 부여하는술을 의미합니다. 레이블 지도 학습(supervised)에서 모델 학습할 수 있도록 입력 데이터에 부여되는 정답 또는 분류 정보를 말하며, 예를 들어 이미지 데이터에 "고양이", "개와 같은 객체 이름 붙이...
# SHAP 값 ## 개요 SHAP 값(Shapley Additive exPlanations) 머신러닝 모델의 예측 결과를 해석하기 위한모델 해석성**(Interpretability) 기법 중로, 게임 이론의 **샤플리 값**(Shapley Value) 개념을 기반으로 합니다. SHAP은 각 특성(feature)이 모델의 개별 예측에 기여한 정도를 정량...
# 트랜스포머 아처 ## 개요 **트스포머**(Transformer) 아처는 자연어(NLP) 분야 혁명적인 변화를끌어낸 딥러닝 모델 구조로, 2017년 구글 딥마인드 연구진이 발표한 논문 *"Attention is All You Need"*에서 처음 소개되었습니다. 기존의 순적 처리 방식(RNN LSTM 등)에 의존하던 자연어 모델들과 달리, 트랜스포머...
# Few-shot 학습 ## 개 **Few-shot 학습**(Few-shot Learning)은 머신러닝 특히 딥러닝 분야에서 **매우 적은 수의 학습 샘플**(예: 클래스당 1~5개)만으로 새로운 개념 클래스를 학습하고 인식 수 있도록 하는 학습 방법입니다. 전통적인 지도 학습은 수천에서 수백만 개 레이블링된 데이터를 필요로 하지만, 실제 응용에서는...
# 프롬프트 기반 추 ## 개요**프롬프트반 추론**(-based Reasoning) 인공지능, 대규모 언 모델(Large Language Models,LM)의 성능을 평가하고 향상시키기 위한 핵심적인 방법론 중 하나입니다 이 기법은 모델이 주어진(프롬프트)을 바으로 논리적 사고, 추론, 해결 능력을 발휘하도록 유도하는 방식으로, 전통적인 지도 학습 방식...