# 분류 ## 개요 **분류**(Classification)는 머신러닝에서 대표적인 지도 학습(Supervised Learning 과제 중 하나로, 주어 입력 데이터를 미리 정의된 **카테고리**(클래스) 중 하나로 할당하는 작업을 말합니다. 예 들어, 이메이 스팸인지 정상인지 판단하거나, 의료 데이터를 기반으로 환자가 특정 질병에 걸렸는지를 예측하는 ...
검색 결과
"계산"에 대한 검색 결과 (총 868개)
# CLIP: 컨텍스트 기반 다중 모달 모델 ## 개요 **CLIPContrastive Language–Image Pre-training)은 OpenAI에서 2021에 발표한 **티모달 인공지능 모델**로, 이미지와 텍스트 간의 관계를 학습하여 시각적 정보와 언어 정보를 동시에 이해하는 능력을 갖춘 대표적인 모델입니다. CLIP은 전통적인 컴퓨터 비전 ...
# 단어 임딩 단어 임베딩(Wordding)은 자연어 처리(N Language Processing, NLP) 분야에서어의 의미를 컴퓨터가 이해할 수 있도록 수치화하는심 기술 중입니다. 이 기술은 단를 고차원수 벡터로 표현함으로써, 단어 간의 의미적 유사성, 문맥적 관계, 문법적 특성 등을 효과적으로 포착할 수 있게 해줍니다. 현대 인공지능 기반 언어 모델...
# One-Class SVM **One-Class SVM**(One-Class Support Vector)은 비지도 학습(Unsupervised Learning) 기반의 이상 탐지(Anomaly Detection) 알고리즘 중 하나로, 주어진 데이터가 정상(normal) 데이터인지, 아니면 이상(anomaly 또는 outlier) 데이터인지를 판단하는 데...
# 다항식 커널 ## 개요 다항식널(Polynomial Kernel)은 **신러닝**, 특히 **서포트 벡터 머신**(Support Vector Machine, SVM)과 같은 커널 기반 알고리즘에서 널리 사용되는 비선형 커널 함수 하나입니다. 이 커은 입력 데이터 간의 유사도를 고차원 공간에서 효과적으로 계산함으로써, 선형적으로 분리되지 않는 복잡한 ...
# L∞ 노름 ## 개요 L∞ 노름-infinity norm), **최대 노름**(maximum norm), **균등 노름**(uniform norm), **서프리멈 노름**(supremum norm)은 벡터 공간 또는 함수 공간에서 벡터나 함수의 크기를 측정하는 방법 중 하나로, 선형대수학과 함수해석학에서 중요한 역할을 한다. L∞ 노름은 벡터의 성분...
# FORTRAN 7 ## 개요 FORTRAN 7은 **FORTRAN**(****mula ****slation의 약자) 계열의 프로그래밍어 중 하나로, 1978년에 공식적으로 미국국립표준협회(American National Standards, ANSI)에 의해 표준화된 버전. 공식 명칭은 **ANSI X3.9-197**이며, 일반적으로 **FORTRAN...
# IPsec ## 개요 IPsec(IP Security)는 인터넷 프로토콜(Internet Protocol) 기반 통신에서 데이터의 기밀성, 무결성 인증을 보장하기 위해 설계된 보 프로토콜 모음입니다. IPsec은 주로 네트워크 계층(OSI 모델의 3계층)에서 작동하며, IP 패킷 단위로 보안을 제공함으로써 네트워크 통신의 전반적인 보안을 강화합니다....
# 결측치 처리 ## 개요 결측치 처리(Missing Data Handling)는 데이터 과학 및 통계 분석에서 중요한 전처리 과정 중 하나로, 데이터셋 내에서 일부 값이 누락된 경우(NaN, NULL, 빈 값 등) 이를 어떻게 처리할지를 결정하는 절차를 의미합니다. 현실 세계의 데이터는 다양한 이유로 결측치를 포함할 수 있으며, 이를 적절히 처리하지 ...
# 어휘 크기 ## 개요 **어휘 크기**(ocabulary Size)는 자연어처리(NLP, Natural Language Processing) 모델 설계에서 중요한 하이퍼파라미터 중 하나로, 모델이 인식하고 처리할 수 있는 고유 단어(또는 서브워드 토큰)의 총 수를 의미합니다. 어휘 크기는 언어 모델의 표현 능력, 메모리 사용량, 학습 및 추론 속도,...
# Haskell Haskell은 함수형 프로그래밍어의 대표적인 예로, 수학적 함수의 개념을 바탕으로 프로그래을 수행하는 고급 언어. 190년에 설계 이래로 순수 함수형 프로그래밍, 게으른 평가(lazy evaluation), 정적 타입 시스템, 타입 추론 등 현대 프로그래밍 언어 연구에 큰 영향을 미친 언어로 평가받고 있습니다. 이 문서는 Haskell...
# 레이블 인코 ## 개요 **레이블 인딩(Label Encoding)**은 머신닝 및 데이터 과학 분야에서 범주형 데이터(categorical data)를델이 처리할 수 있는 수치형 데이터로 변환하는 대표적인 전처리 기법 중 하나입니다. 범주형 변수는 일반적으로 텍스트 형태의 값(예: '남성', '여성', '서울', '부산')으로 구성되어 있으며, 대...
# WordPiece ## 개요 **WordPiece**는 자연어 처리(Natural Language Processing, NLP 분야에서 널리 사용되는 하위 어휘(subword) 토큰화 기법 중 하나로, 특히 **BERT**(Bidirectional Encoder Representations from Transformers) 모델에서 기본 토큰화 방식...
# SSE2 **SSE2**(Streaming SIMD Extensions 2)는 인텔이 2001년에 펜티엄 4 프로세서와 함께 도입한 SIMDingle Instruction, Multiple Data)령어 집합의 확장판입니다. SSE2는 이전의 SSE(SSE1)를 보완하고, MMX 및 x87 부동소수점 연산의 많은 제한을 극복하기 위해 설계되었으며, 특...
# PDF ## 개요 PDF는 " Density Function"의 약자로, 한국어로는 **확률밀도함수**(確率密度函數라고 한다. 통학과 확률론에서 연속 확률변수의 확률 분포를 설명하는 데 핵심적인 역할을 하는 함수이다. PDF는 특정 값에서 확률변수가 나타날 **상대적인 가능성**을 나타내며, 연속 확률변수의 확률을 구할 때는 특정 구간에 대한 함수의...
# Global Vectors for Word Representation**Global Vectors for Word RepresentationGloVe) 단어를 고차 벡터 공간에 표현하는 대표적인 **언어 모델링 기법** 중 하나로, 단어 간의 의미적 관계를 수치적으로 포착하는 데 목적을 둔다. GloVe는 분포 가설(Distributional Hypot...
# 자기 주의 자기 주의(자기어텐션, Self-Attention)는 딥러닝, 특히 인공지능 자연어 처리(NLP) 분야에서 핵심적인 역할을 하는 신망 구성 요소. 이 메커니즘은 입력 시퀀스 내의 각 요소가 다른 요소들과 어떻게 관계되는지를 모델이 학습할 수 있도록 하며, 전통적인 순환 신경망(RNN)이나 합성곱 신경망(CNN)보다 더 유연하고 강력한 표현 ...
# 신호 처리 신호 처리(Signal Processing)는 물리적 현상이나 시스템에서 발생하는 신호를 분석, 변환, 조작하여 유용한 정보를 추출하거나 신호의 품질 향상시키는 기술 및 학문 분야이다. 신호는 시간 또는 공간에 따라 변화하는 물리량으로, 음성, 이미지, 전압, 진동, 전파 등 다양한 형태로 나타날 수 있다. 신호 처리는 통신, 의료 영상, ...
# 스킵-그램 (-gram) ## 개요 스킵-그램(Skip-gram)은 자연어 처리(Natural Language Processing, NLP) 분야에서 널리 사용되는어 모델링 기법으로 **워드 임베딩**(Word Embedding) 생성하는 데 핵심적인 역할을 한다. 스킵-그램은 2013년 토마스 미코로프(Tomas Mikolov)와 구글 연구팀이 제...
# FastText FastText는 페이스북(Facebook AI Research, FAIR에서 개발한 오픈소스 라이브러리로, 텍스트 분류 및 단어 표현 학습을 위한 효율적이고 확장 가능한 자연어처리(NLP) 도구입니다. FastText는 기존의 단어 임베딩 기법인 Word2Vec과 유사한 목표를 가지지만, **서브워드(subword) 정보**를 활용함...