BERT
# BERT (Bidirectional Encoder Representations from Transformers) **BERT**(Bidirectional Encoder Representations from Transformers)는 구글(Google)이 2018년...
# BERT (Bidirectional Encoder Representations from Transformers) **BERT**(Bidirectional Encoder Representations from Transformers)는 구글(Google)이 2018년...
# KoGPT **KoGPT**(Korean Generative Pre-trained Transformer)는 네이버 클라우드(Naver Cloud Platform)에서 개발한 한국어 특화 대규모 언어 모델(Large Language Model, LLM)입니다. 이 ...
# Supervised Fine-tuning (지도 미세 조정) **Supervised Fine-tuning**(SFT, 지도 미세 조정)은 대규모 언어 모델(Large Language Model, LLM)이나 다른 딥러닝 모델을 특정 작업이나 도메인에 맞게 전문화시...
# 인공지능: 확률적 모델과 현대 AI의 기초 ## 개요 **인공지능(Artificial Intelligence, AI)**은 인간의 지능적 행위를 모방하여 문제를 해결하거나 결정을 내릴 수 있는 컴퓨터 시스템이나 소프트웨어를 포괄하는 광범위한 기술 분야입니다. 초...
# 편향 (Bias) **편향(Bias)**은 인공지능(AI) 시스템이 학습 데이터나 알고리즘 설계 과정에서 발생하는 체계적인 오류로 인해 특정 개인이나 집단에 대해 공정하지 않거나 차별적인 결과를 도출하는 현상을 의미합니다. 특히 인공지능의 **공정성(Fairnes...
# 혼합 전문가 모델 (Mixture of Experts, MoE) ## 개요 **혼합 전문가 모델**(Mixture of Experts, 줄여서 **MoE**)은 대규모 언어 모델(LLM) 및 딥러닝 아키텍처에서 사용되는 효율적인 신경망 설계 패턴입니다. MoE의...
# 환각 (환각 현상) **환각**(幻覺, 영어: **Hallucination**)은 생성형 인공지능(Generative AI), 특히 대규모 언어 모델(Large Language Models, LLMs)이 사실과 다르거나 존재하지 않는 정보를 사실인 것처럼 생성해 ...
# 파괴적 망각 (Catastrophic Forgetting) 파괴적 망각은 연속 학습(Continual Learning) 환경에서 인공지능 모델이 새로운 작업을 학습하는 과정에서 기존 작업의 성능이 급격히 저하되는 현상을 의미합니다. 이는 인간 학습자가 새로운 지식...
# 머신러닝(Machine Learning) 머신러닝은 명시적인 프로그래밍 없이 컴퓨터가 데이터를 통해 스스로 학습하고 패턴을 인식하여 예측 또는 결정을 내리는 인공지능(AI)의 핵심 하위 분야입니다. ## 머신러닝의 개요와 정의 머신러닝은 아서 사무엘(Arthu...
# 환각 (Hallucination) **환각**(Hallucination, 줄여서 **Hallu**)은 인공지능, 특히 대규모 언어 모델(LLM)이 사실과 다르거나 존재하지 않는 정보를 확신에 차서 생성하는 현상을 의미합니다. 이는 인공지능의 신뢰성을 해치는 주요 ...
# 재현율 (Recall) **재현율**(Recall)은 머신러닝과 데이터 과학 분야에서 분류(Classification) 모델의 성능을 평가하는 핵심 지표 중 하나입니다. 특히 불균형 데이터(Imbalanced Data)가 존재하거나, 거짓 음성(False Nega...
# 그래프 신경망 (Graph Neural Networks) **그래프 신경망**(Graph Neural Networks, **GNN**)은 그래프 구조의 데이터를 직접 처리하고 학습할 수 있는 딥러닝 모델의 한 종류입니다. 기존 합성곱 신경망(CNN)이 정방형 그리...
# 리니어ReLU (LinearReLU) **리니어ReLU(LinearReLU)**는 인공 신경망(Artificial Neural Networks)에서 활성화 함수(Activation Function)로 사용되는 수학적 연산자입니다. 이 함수는 입력값이 양수일 경우 ...
# 예측 제어 (Predictive Control) **예측 제어**(Predictive Control)는 공학 및 제어 이론에서 시스템의 미래 동작을 예측하여 최적의 제어 입력을 결정하는 고급 제어 기법입니다. 특히 **모델 예측 제어**(Model Predicti...
# 순환 신경망 (Recurrent Neural Network, RNN) ## 개요 **순환 신경망**(Recurrent Neural Network, 약자 **RNN**)은 인공 신경망의 한 종류로, 시계열 데이터나 연속된 데이터 시퀀스를 처리하는 데 특화된 아키텍...
# Stable Diffusion **Stable Diffusion**(스테이블 디퓨전)은 텍스트 설명(text prompt)을 바탕으로 고품질의 디지털 이미지를 생성하는 딥러닝 기반의 생성형 인공지능 모델입니다. 2022년 독일의 스태빌리티 AI(Stability ...
# 가중치 (Weight) **가중치**(Weight)는 인공 신경망(Artificial Neural Network, ANN) 및 머신러닝 모델에서 입력 데이터의 중요도를 결정하는 핵심 매개변수입니다. 신경망이 학습을 통해 데이터를 이해하고 예측하는 과정에서 가장 중...
# 알파고 (AlphaGo) **알파고**(AlphaGo)는 구글 딥마인드(DeepMind)가 개발한 인공지능(AI) 프로그램으로, 고대 중국의 보드 게임인 **바둑**을 플레이하기 위해 설계되었습니다. 알파고의 가장 큰 의의는 인간 전문가를 상대로 바둑에서 승리한 ...
# GRU (Gated Recurrent Unit) **GRU**(Gated Recurrent Unit, 게이트드 리커런트 유닛)는 순환 신경망(RNN, Recurrent Neural Network)의 한 변형 모델로, 장기 의존성 문제(Long-term Depend...
# LAMB (Layer-wise Adaptive Moments optimizer for Batch normalization) **LAMB**(Layer-wise Adaptive Moments optimizer for Batch normalization)는 대규모 배...