검색 결과

"softmax"에 대한 검색 결과 (총 46개)

Large Language Model

기술 > 인공지능 > 머신러닝 | 익명 | 2025-08-04 | 조회수 97

# Large Language Model ## 개요 **Large Language Model**(대규모 언어 모델, 이하 LLM)은 자연어를 이해하고 생성할 수 있도록 설계된 심층 신경망 기반의 인공지능 모델로, 수십억에서 수조 개의라미터를진 대규모 구조를징으로 합니다. 이 모델들은 방대한 양의 텍스트 데이터를 기반으로 사전 학습(pre-training...

셀프-어텐션

기술 > 인공지능 > 머신러닝 | 익명 | 2025-07-30 | 조회수 73

# 셀프-어텐션 ## 개요 셀프-어텐션(Self-Attention)은 인공지능 분야에서 시퀀스 데이터의 상호작용을 모델링하는 데 사용되는 핵심적인 기술입니다. 특히 **트랜스포머(Transformer)** 아키텍처의 핵심 구성 요소로, 자연어 처리(NLP) 및 컴퓨터 비전(CV) 등 다양한 분야에서 혁신을 이끌었습니다. 이 메커니즘은 입력 시퀀스 내 모든...

활성화 함수

기술 > 인공지능 > 머신러닝 | 익명 | 2025-07-14 | 조회수 77

# 활성화 함수 ## 개요/소개 활성화 함수는 인공신경망(ANN)에서 입력 신호를 처리하여 출력을 생성하는 데 사용되는 핵심 요소입니다. 이 함수는 신경망이 비선형 관계를 학습할 수 있도록 하며, 단순한 선형 모델로는 해결 불가능한 복잡한 문제(예: 이미지 인식, 자연어 처리)를 해결하는 데 기여합니다. 활성화 함수의 선택은 네트워크 성능, 수렴 속도...

드롭아웃

기술 > 인공지능 > 머신러닝 | 익명 | 2025-07-14 | 조회수 113

# 드롭아웃 (Dropout) ## 개요 드롭아웃(Dropout)은 인공지능(AI) 분야에서 네트워크 과적합(overfitting)을 방지하기 위한 **정규화 기법**으로, 신경망의 훈련 중 일부 뉴런을 무작위로 비활성화하는 방법이다. 이 기법은 2014년 제프리 힌턴(Jeffrey Hinton) 등이 발표한 논문에서 처음 소개되었으며, 현재 딥러닝 모델...

딥러닝

기술 > 인공지능 > 머신러닝 | 익명 | 2025-07-14 | 조회수 95

# 딥러닝 ## 개요 딥러닝(Deep Learning)은 인공지능(AI)의 하위 분야로, 인간의 뇌 구조를 모방한 신경망(Neural Network)을 기반으로 데이터에서 복잡한 패턴을 학습하는 기술입니다. 2010년대 이후 컴퓨팅 파워와 대량 데이터의 확보로 급속히 발전하며, 컴퓨터 비전, 자연어 처리(NLP), 음성 인식 등 다양한 분야에서 혁신적인 ...

다중 로지스틱 회귀

기술 > 데이터과학 > 분석 | 익명 | 2025-07-10 | 조회수 92

# 다중 로지스틱 회귀 ## 개요 다중 로지스틱 회귀(Multinomial Logistic Regression)는 **이산형 종속 변수**를 예측하기 위한 통계적 모델로, 이진 로지스틱 회귀(Binary Logistic Regression)의 확장 형태이다. 이 방법은 두 가지 이상의 클래스(범주)를 가진 문제에 적용되며, 각 클래스에 대한 확률을 동시에...